理想智驾从此站起来了？ -

对于理想AD Max用户来说，今天绝对是一个值得庆祝的日子。

理想汽车在今天正式召开了智能驾驶夏季发布会，主要内容包含了：

– 基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构；

– 将于7月内推送的全自动AES和全方位低速AEB。

其中，端到端模型、VLM视觉语言模型和世界模型是理想AD Max的全新技术，这项技术能够帮助理想汽车智能驾驶摆脱对先验信息的依赖，在全国范围内实现有导航覆盖即可使用NOA。

而全自动AES和全方位低速AEB，则能够让理想AD Max在更多场景下实现更好的主动安全能力。

下面我们一项一项来看。

首个双系统架构方案

大多数人今天关注的重点是理想的全新的双系统技术架构，早在近一个月前的「2024中国汽车重庆论坛」上，李想就分享了这套理想汽车的最新技术架构。

理想团队在一本书《思考，快与慢》中得到启示：

我们人类的大脑日常在工作的时候，分为系统一和系统二。系统一来处理一些需要直觉和快速响应的事情。系统二处理比较复杂的逻辑推演工作。

代入到人类的驾驶行为，日常近95%的驾驶任务是不需要推演的，开车时脑子里甚至还可以想其他事情，这时候大脑并不是没有工作，而是以一种低能耗的方式在工作。

但是当我们到了复杂路况时，比如遇到复杂的路口、多车混行的路段，我们的大脑就会调用系统二来工作，用它来处理比较复杂的逻辑推演的能力，虽然它对大脑消耗比较大，但我们不会一直以系统二的方式开车。

自动驾驶如果以人类的方式来开车，那么系统一和系统二对应的是什么？

理想汽车认为，现在行业在研究的端到端技术正是自动驾驶需要的系统一，它的效率很高，善于处理简单任务，是人类基于经验和习惯形成的直觉，足以应对驾驶车辆时95%的常规场景。

系统二则是理想率先基于 Orin-X 部署的 VLM 视觉语言模型，它更擅长逻辑推理、复杂分析和计算能力，在驾驶车辆时用于解决复杂甚至未知的交通场景，占日常驾驶的约5%。

系统一和系统二的相互配合，分别确保大部分场景下的高效率和少数场景下的高上限，成为人类认知、理解世界并做出决策的基础。

系统一，即端到端

理想汽车的端到端输入主要由摄像头和激光雷达构成，多传感器特征经过CNN主干网络的提取、融合，投影至BEV空间。

为了提升模型的表征能力，理想汽车加入了记忆模块，具备时间和空间的记忆能力。

在模型的输入中，理想汽车还加入了汽车的状态信息和导航信息，经过 Transformer模型的编码，输出感知任务，包含了动态障碍物、道路结构和通用障碍物等等，并规划行车轨迹。

输入感知信息，输出规控轨迹，这是理想AD的系统一，端到端模型。

更擅长「读图」的VLM模型

VLM 视觉语言模型，通俗地说，这是一个擅长解读照片的网络。

我们都知道，自动驾驶感知主要输入的是图片，这是最重要的信息，但如何让系统读懂信息，这是最关键的一步。

VLM 模型相对来说更擅长这些场景理解，能识别和描述道路环境、交通标志、动态交通参与者等等。通过不断的训练，VLM能够进行自主推演。例如交警的手势，大多数模型架构是无法解决「读懂」的，甚至人的大脑都需要推理，但是VLM可以承担这部分任务。

这就是为什么李想说，VLM是端到端很好的补充。

理想汽车的VLM视觉语言模型参数量达到22亿，对物理世界的复杂交通环境具有强大的理解能力，许多场景即便是第一次经历，也能够很好地化解。

再举个例子，VLM模型可以理解公交车道、潮汐车道和分时段限行等复杂的交通规则，在驾驶中作出合理决策。

可以说，VLM给端到端在给端到端这种不可加规则的模型进行了很好的兜底。

但是，VLM本身也是黑盒，理想为了验证双系统的安全性，用 Diffusion Transformer 的方式来构建一个重要的、小型的世界模型，拿到这个世界模型，让车在里面考试。

理想汽车结合端到端模型和VLM视觉语言模型，成为了首个在车端部署双系统的方案，也首次将VLM视觉语言模型成功部署在车端芯片（Orin-X）上。

主动安全

看完了发布会，我对理想智驾的印象只有一个字，那就是卷。不仅仅是城区NOA的前瞻研发和工程化落地，在主动安全上，理想也把场景和功能类型做到了非常丰富和完备。

理想的主动安全包含了四大能力，分别是复杂路口的AEB、夜间弱光AEB、全自动AES和全方位低速AEB。

我们分别来看这四大场景的能力和价值。

复杂路口指的是当我们在人车混行的转弯行驶时，尤其是转弯时，驾驶员的视线是存在盲区的，这时候主动AEB就能够帮助驾驶员规避风险。

尤其是横穿的儿童，这是典型的高危场景。

夜间弱光环境下，驾驶员视线会受到严重干扰，尤其是在闪着灯的龙门架下，更是一个难解的场景。理想这次也针对夜间暗光环境做了升级，确保功能极限够高。

全自动AES（自动紧急转向）指的是，在车辆行驶速度较快时，留给主动安全系统的反应时间极短，部分情况下即使触发AEB，车辆全力制动仍无法及时刹停。这个时候，AES功能将被及时触发，无需人为参与转向操作，自动紧急转向，避让前方目标，从而避免碰撞的发生。

最后一项，全方位全方位低速AE则针对泊车和低速行车场景。

在我们日常泊车时，停车场可能存在一些低矮的障碍物，甚至会出现儿童，全方位低速AEB能够识别前向、后向和侧向的碰撞风险，及时紧急制动，避免碰撞发生。

以上这些功能，都会在7月推送给用户。

在这里理想汽车也分享了一组数据，在202年上半年，理想汽车AD Max主动安全系统已经显著降低了人类驾驶事故率：人类驾驶事故率降低30%、人类驾驶事故避免36万起、AEB误触发率每30万公里小于1次。

写在最后

今天的发布会全程围绕智驾，并且在看完后，我相信大多数人都有两点感触。

第一，过去我们国内OEM与智驾供应商提出的技术，都是特斯拉在AI DAY上和CVPR上已发布的技术。

在智驾前瞻技术上，我们一直是跟随的角色，但是理想今天的技术，让行业获得了久违的新鲜感，我们要鼓励前瞻技术的探索和工程落地。

第二，我们的新势力一直在卷主动安全，这是最不怕卷的领域，消费者需要更好、更强的主动安全能力。

什么是卷出价值？这就是最好的诠释。