理想在自动驾驶前夜,解决了人机信任危机

王洪浩的进化论 2025-02-12 11:44:49
重要的话先说:

李想在AI Talk中表示将用三年时间实现智能驾驶L4。条件是理想团队内部人才、资金、技术到位,外部政策环境到位,消费者对于人工智能的信任到位。

信任是最难解决的一环。无法充分信任他人是人的本性,更别说信任机器了。拉升智能驾驶普及率的前提是解决信任危机。这是行业共识,因此初级智能驾驶功能普及后就有相应增强信任的功能出现。

1.0时代车企推出ADS可视化。它通常在仪表屏上显示本车与外界车辆、环境的相对信息。该功能在规则算法时代是有用的。前车停,我即停;前车慢,我即变道……算法锁死了车辆识别到的信息即对应做出的动作。用户知道,只要车能看见外边的世界,它的行为可能不是最高效的,但一定不会犯规。

现在的情况是智驾正在抛弃规则算法,智驾进入城市面临复杂的交通状况,与众多道路参与者博弈。累死工程师也不可能穷尽所有预设场景,corner case(难例数据)必然存在。实现城市NOA(根据导航路线的领航辅助驾驶),车要像人一样思考。对智驾更高维度的考验是不只要平安到达目的地,还要高效。系统要像老司机一样选择最优车道,而不是锁死在规则定义中的快车道。

于是端到端成为2024年最热的关键词,它代表着规则算法向AI人工智能算法的进化。特斯拉FSD V12系统改用端到端模型后,算法从此前的三十万行骤降到三千行。理想AD Max V13.0是端到端+VLM智能驾驶的最新版本号,具备「全球首家」车位到车位智驾、「全国任意」高速收费站ETC自主通行等重磅功能。它的水平相当于特斯拉北美FSD最新版本V13.2水平。

端到端的出现让1.0时代的人机信任崩盘。因为车不再只有眼睛,它们拥有了大脑开始思维,用户需要看到车的思维才能给予信任。理想AD Max V13.0同时也具备AI推理可视化功能,其在1月16日随OTA7.0版本正式推出,由此开启人机信任的2.0时代。

AI推理可视化界面分为三个板块:

端到端模型。在多车博弈过程中,它提供10条规划路线并自行给出合理性判断。

注意力系统。实时视频流当中,对智驾决策影响大的道路参与者以暖色(偏红)标注,对决策影响较小的则用冷色(偏蓝)标注。

VLM视觉语言模型。当识别到有对智能驾驶决策有影响的环境路况和交通规则变化时,VLM 能够及时感知信息,并用对话框信息的形式告诉驾驶者车辆的推理决策。

在这些功能点背后理想团队是怎么思考的?

| 直给信息,不炫技

理想团队在定义注意力系统和视觉语言模型的交互界面时,博弈的点在于直给用户临场的视频流信息,还是将视频流做高大上的渲染再呈现给用户。

为什么选前者?

2023年底,理想曾向用户短暂地开放了智驾系统的工程界面。这个界面展现的不是精致渲染后的ADS可视化界面,而是摄像头、激光雷达等传感器识别到的信息在系统中拼合完是什么样。系统看到的世界相当简单,用一些线和框就能描述复杂的外部世界。

界面下线后,大量用户呼吁工程师再把它更新回来。这种热情不难理解。系统视角代表着真实,渲染出来的界面反而代表虚假。真实的信息给人更强的安全感。

另外,中国有一波偏专业的用户群体,塑造这群人的是十年前的小米和苹果。小米刷机、苹果越狱,这两件事培养了大量动手能力强的人自己上手做系统。彼时百度贴吧里有大量刷机教程。一夜间,过街天桥上小商贩们全都把“手机贴膜”的招牌换成了“刷机、越狱”。中国智能汽车的兴起承接了这波用户的兴趣。他们喜欢研究系统,探索系统看世界的猎奇视角。

用户洞察之外,理想团队希望用户的关注点更在技术本身,所以要直给、直给、直给……

| 克制信息量,不打扰

AI推理可视化功能本身是一种交互设计,设计透传理想的审美。通常高级的审美都需要克制。

什么是克制?

小孩喜欢吃糖,它能直接刺激大脑分泌多巴胺。成年人会克制自己吃糖的欲望,因为他们会看到糖有害的一面而放弃。高级消费者更知道什么东西真正适合自己,替代品可能是茶、咖啡、红酒……

人们在装修房子时开始放弃看似华丽的吊灯。它会大幅侵占屋子的纵向空间,使观感压抑,而且照明效果并不好。越来越多人选择无主灯设计,把灯藏起来,通过漫反射照明全屋。比起花里胡哨,明亮、通透是真正让人生活舒适的风格。

理想、蔚来的内饰氛围与无主灯的起居室异曲同工。内饰设计给用户提供的价值是舒适。对立面是当代奔驰S级、宝马7系,它们内饰氛围更像KTV,提供完全相反的用户价值。

AI推理可视化向用户传递信息以建立信任。过度的信息会打扰用户,与理想创造家和舒适感的品牌理念背道而驰。

视觉语言模型交互窗口容易信息饱和,它传递图片+文字两种信息。读图是容易的,读文字需要较长时间且分散注意力。所以视觉语言模型的不是全时段提供信息,否则会打扰用户。它的作用是当用户处在紧张环境中时,给予反馈,安抚情绪。

Corner case是无法被穷尽的,但让人产生不安感的环境可以。比如夜晚无灯小路、丁字路口、公交车道(无限行时间)、公交车道(有限行时间)、学校路段减速、上下高架时导航纠偏、主辅路切换时导航纠偏、隧道内外、坑洼路面/土路、施工场景、变道、转弯、急减速、红绿灯刹停/起步、路面静态障碍物、驶入匝道、旁边存在大车。视觉语言模型的交互只会出现在这类场景中。

最后

蔚来十周年之际,李斌的内部信如同战斗檄文。这是汽车行业从排位赛进入淘汰赛的转折点。上汽总裁的内部讲话、吉利的《台州宣言》,这些预示着未来行业竞争会加倍激烈。车企想应对更高维度的竞争唯有加码技术。理想转型AI公司是一种方式,在汽车的框架外为汽车产品赋能。

0 阅读:4
王洪浩的进化论

王洪浩的进化论

最懂汽车品牌历史的故事王