拥有足够的行车数据,大模型是否能取代我们

0

今年大模型的突破,被很多人视为人工智能的新一轮技术革命。

不过这几个充斥着宏观色彩的文字似乎并不适用于圈外人。对于更多人来说,之所以关注大模型,是因为在文明历史中我们乐此不疲的制造和使用工具,而其中之一的大模型释放出了能优化生活方式的最亮眼的信号。

在今年的世界人工智能大会(WAIC)期间,我们来到了商汤科技召开的“大爱无疆·日日新”人工智能论坛。和聚集在这里的其他人一样,我们关注的正是全面升级后的「商汤日日新SenseNova」大模型体系,以及在该体系下的一系列大模型产品更新和落地成果。

关于「商汤日日新SenseNova」大模型体系,我们在上海车展期间已有报道,大家可以点进【大模型之战,商汤押宝智能座舱】中查看,在此不做赘述。

这套模型体系已经和商汤在2021年推出的智能汽车解决方案「商汤绝影」做了融合,在智能驾驶、智能座舱、路云感知、赋能引擎以及AI底座方面都有所竞争力。

不过行业普遍的短板仍然限制着这套解决方案,尤其是最难攻克的智能驾驶问题。

例如智能汽车为了实现更高阶的智能加速辅助,普遍配有众多传感,然而在现阶段,不同类型的传感器所输出的信号并不能进行很好的融合,多模态的数据处于一种割裂的状态。

为此,商汤提出了业内首个感知决策一体化的自动驾驶通用大模型——UniAD。

和传统算法不同,UniAD将感知与决策流程一体化,具体方式为:将检测、跟踪、建图、轨迹预测,占据栅格预测以及规划,整合到一个基于Transformer的端到端网络框架下,以最终驾驶目的为目标。

这和人类开车逻辑更为接近,当我们身处某场景时会直接做出决策,而决策的水平就去取决于我们过去潜移默化的认知、训练和经验。UniAD大模型正是通过大量数据去学习,达到直接给出指令。

这不仅开创了首个以全局任务为目标的自动驾驶大模型架构,也为自动驾驶技术与产业的发展提供了新的方向。

根据现场演示的案例来看,即便在没有车道引导线且没有高精度地图可以依赖的停车场内,UniAD通过深度融合地图分割模块和规划控制模块,已经可以做出和人类司机接近的路线规划和判断。

这就是“解决实际问题”的表现。在学生时代,我们经常为课本例题和考试题目形式画不上等号而苦恼。

智能汽车同理,在训练时以车道线为规划路线的思路,一旦失去车道线就不知所措。而更聪明的做法就是直击考点,以”停车“为目标完成“障碍物追踪、目标轨迹的预测“的任务就能解决问题。

此外,依托『大模型+大装置』(大装置可理解为支撑大模型运转的后台中心,在硬件、软件、人力上付出巨大投入)的强大能力,「商汤绝影」也可以通过车、路、云的协同,去打造更完善的自动驾驶交通体系。

简单来说,就是搭载商汤方案的智能车在行驶过程中通过BEV感知去采集路面信息并传回数据库,接收到信息后「商汤绝影」可以通过大模型体系里的两个模型「商汤琼宇」(场景生成平台)+「商汤格物」(物体生成平台)构建出城市级的三维场景。

最终,利用「商汤商量」的感知推理和人机交互能力,推动车、路、云共同向大模型对话式交互的演进,大幅度提升协同效率和安全性。也就是“大脑里演练一遍觉得可行然后做出行动”。

智能座舱,同样也是一个可以充分发挥大模型能力的场景。

在现场,商汤展示了健康问诊、旅游规划、儿童伴读和AR说明书等多款利用大模型打造的智能座舱应用。其中,AR说明书确实给笔者留下了不错的第一印象。

在此本人先做反思,尽管每辆车出厂时都会配备一本厚厚的说明书,但能认真阅读的车主并不多,我也不能做到面对特殊情况就能想起来说明书中的指导。尤其在车辆出现故障时,各种操作都手忙脚乱,更顾不上看说明书了。

而经过大模型赋能之后的说明书,除了精通各种车辆故障和问题,还能通过车辆的语音助手以及AR显示的方式帮助车主快速地定位到车辆的具体故障点,并提供相应的解决方案。这对于车主来说,要更加方便且实用。

有人说,大模型再大也永远是现实世界的一个子集。那么通过大模型的训练,究竟能不能实现真正的自动驾驶?相信这是不少人都好奇且关心的。针对这个问题,AutoLab也对商汤科技联合创始人、首席科学家王晓刚进行了采访。

对此,他是这样回答的:人的认知本身也是现实世界的一个子集,而且是在不断演进的过程当中。对于大模型来说,最核心的是看到它能够带来哪些革命性的变化,可能在未来也会结合其他维度的突破,不断有新的成果产生。

他尤其肯定大模型会对下一代自动驾驶产生比较深刻的影响。这样的看法和另外一家致力于自动驾驶大模型的企业如出一辙。

毫末智行在今年发布自动驾驶生成式大模型Drive GPT雪湖·海若后,官宣获得3家主机厂定点合同。在毫末人眼中,大模型的前景一片光明:”大模型在数据合成、知识提取等方面的能力将助力自动驾驶迭代速度实现量级提升。”同时,他们认为随着智能驾驶能力的突破,用户体验将从尝鲜变为用户依赖。

“用户依赖”,这是一个在当下提出还会被不少人拒绝的词语。对于AI来说,量变就能引起质变,足够的数据和逻辑就能支撑起一轮技术的迭代。

然而在人类世界中,语言和逻辑也不过是人类设计出的产物。几百年的发展,道德和科技的进步没能解决的交通问题,大模型真的可以解决吗?在《流浪地球2》中高自动化的飞机突然被入侵控制的画面是想象还是警钟,仍然是个未知数。

 

Comments are closed.