李想说的“理想智驾2024年成为绝对头部”真要来了!
1月16日,理想汽车搭载“高速端到端”和行业首创的“AI推理可视化”功能的OTA7.0版本正式向AD Max用户全量推送,成为国内首家、全球唯二实现高速+城市全场景端到端的车企,另一个则是自动驾驶的领先者特斯拉。
理想表示,自OTA 5.0版本切换至BEV架构并推出城市NOA起,理想便对AD Max启用了独立的版本号管理。在过去一年中,理想共完成了12次AD Max的重大更新。
为了使用户更清晰地感知智能驾驶的升级变化,此次OTA 7.0升级中,AD Max的内部智能驾驶版本号将向用户展示,智能驾驶版本升级为AD Max V13.0。
长期以来,被视作“智驾领域后来者”的理想汽车其实在今年5月才开启无图NOA内测,仅仅8个月时间就完成了“全场景端到端”的能力释放。
这意味着,理想汽车短时间内就实现了智驾技术的飞跃发展,完成了从追赶、持平到领先的追越,进入了世界第一梯队的智能驾驶水平。
作为理想L6 Max车主,驾仕派回顾了提车后的这6-7个月时间,从7月理想OTA 6.0 推出的无图NOA,到10月OTA 6.4版本全量推送端到端+VLM智驾,以及本次OTA7.0的全场景端到端+AI推理可视化,几乎每个大版本都进行了冲锋体验,更深刻感知到了理想汽车在高阶智驾能力上“以月为单位”的提升。
那么,为什么理想汽车可以在智驾领域做到如此快速地迭代、完成后来居上?作为中国汽车市场首批“吃到”基于one-model端到端+VLM“螃蟹”的用户,借着驾仕派在抢先升级、体验到理想汽车全场景端到端+AI推理可视化的契机,我们也想分享一些理想最新版本的实际体验和对理想汽车智驾发展的思考。
01
全场景端到端+AI推理可视化究竟是什么?
从字面上来理解,全场景端到端即城市、高速环路、高速路等场景都采用一体化的端到端技术架构,而AI推理可视化则是让用户直观地看到理想汽车这套智驾系统如何捕捉路况信息并做出选择。
如上图,即是AI推理可视化的界面:
1、我们可以看到中间Attention窗口中类似热感应的区域,代表了理想这套端到端系统对人、车、路沿等信息的关注度差异;
2、而图中E2E窗口则是端到端技术的体现,显示了端到端技术实时推理出的10种模态轨迹,系统会选出概率最大的作为最优的决策轨迹;
3、VLM窗口则是展示出它读取的路况信息,例如道路标识等,用作分析复杂路况。
换句话说,理想汽车现在把整套智驾系统的感知和决策逻辑展示给了用户,用户可以更清晰地看到系统是怎么做出的决策。这样可以让驾驶者对理想的智能驾驶系统有更多的信心、放心让车辆自己开。
这里面很有意思的地方在于,我们明显可以从界面上看到端到端和VLM是两套不同的系统。端到端给出的一系列运行轨迹的概率,而VLM系统则是通过进行了“自我对话”,把车辆自己“看到”的内容以图片输入、然后输出文字决策。
其实,VLM系统是理想汽车在智驾技术路线上和特斯拉最大的区别。
理想汽车自动驾驶研发副总裁郎咸朋就说:“我们在做技术方案时充分参考了世界上所有的先进方案,但始终无法解决一个问题是,当一套自动驾驶或智能驾驶系统,它工作时如果遇到之前没有见过的场景,应该怎么处理?我们认为就是端到端+VLM,就是系统1+系统2的方式,很好地模仿人类大脑的工作方式。”
你可以把VLM系统理解为一个专门处理复杂场景的系统,它的思考慢一些,但是更准确一些。
比如遇到高速施工道路,或者无法知晓什么是公交优先道、什么时候是可变车道时,端到端模型就会直接开过去。但是VLM却可以通过视觉感知识别,然后告知端到端系统这里是什么情况——比如施工道路车辆需要往左绕行、公交优先道不能通行、潮汐车道现在能不能开——再由端到端系统做出决策和执行。
这时候你还可以看到理想汽车在端到端路线上的一个理念,相比于目前中国市场上其他端到端的智驾方案,理想汽车是基于one-model的端到端技术架构。
所谓“one-model”也就是一段式,直接把传感器收集到的信息放到大模型里面,然后输出执行策略,而传统方式则是感知-预测-规划-控制四个步骤,就算是其他友商同样到了端到端阶段也使用的是感知+预测规控决策两段式模型。
one-model的优势就像传话游戏的人数上限改为了1,即所有感知硬件收集到的信息直接用来做出判断和行动,省去了中间传递可能存在的信息丢失,它不再依靠过去数据形成的模块化规则驱动,而变成了数据直接驱动。
“我们要做端到端时就给自己定了一个目标,一定要用纯数据驱动的方式来做这件事情,而不是结合了之前的规则来做,所以说它的性能上限会非常高。”郎咸朋解释了为什么要用one-model来做端到端,这也就能够理解为什么理想汽车很快实现了高速端到端的能力。
02
全场景端到端+VLM带来了什么?
说回实际体验,这次升级OTA7.0之后理想L6的AD Max体验更为顺滑,更像是“类人”驾驶风格。比如我们看到很多新势力在提到端到端智驾时往往会提到重刹率、接管次数、平顺性等热词,这些恰好也是真实影响用户在使用智驾系统时体验的主因。而理想汽车这套「全场景端到端+AI推理可视化」更新以后,以下四个场景我们认为非常具有代表性。
场景一:
当智驾系统决定变道超车,遇到侧后方车辆突然加速靠近,过去的智驾系统往往很难根据实时情况做出调整,要么继续强行变道,要么急减速、急打方向,这其中就存在追尾或撞到旁边车辆等安全隐患。而OTA7.0之后,我们发现它在变道途中能更像老司机一样行驶平稳,没有重刹或急打方向,这样不仅让变道效率变高,且更安全、体感更好。
场景二:
在使用城市NOA过程中,如果识别到道路限速为60km/h,那么此前的智驾版本车辆加速感会比较明显,而更新后,同类的场景下,车辆更多时候会均匀提速并正常进行跟车或均速行驶,驾驶策略更类人。
场景三:
面对成都道路切换较为复杂的人南立交下二环高架,之后需要跨多车道向右并道、驶入辅路的场景,大多数品牌的高阶智驾能力不足以应付这样的场景。理想在OTA7.0版本更新之后,我们发现它现在可以在等待右侧直行车辆通过后,自主切换到右转的辅路上行驶,并且会及时打开右转向灯提醒后车,还可以进行“变道博弈”,通行效率明显提升。
场景四:
更新OTA7.0之前,车辆从城市道路进入高速时,尽管已经实现了识别ETC自主通行,但是因为之前版本的高速智驾还是基于规则和先验信息的,所以面对城区/高速切换点时往往还是需要驾驶者接管。但是这次OTA7.0版本升级带来了高速端到端,用户可体验到NOA在城市、高速全场景更丝滑无感的智驾,比如成都机场高速收费站前后没有明确车道线,我们驾驶理想L6也能够顺畅行驶。
理想汽车说,高速端到端可以更好地处理新开高速、长隧道、分叉隧道、长距离施工改道、城区/高速切换点等场景,不再受到先验信息的错误或者断点带来的无奈接管,让高速智驾更加安全可靠,打通了城区和高速NOA最后的痛点。换言之,理想汽车OTA7.0之后,真正意义上实现了城市与高速一体化架构,可以无断点、无降级地应对几乎所有复杂路况。
体验下来,目前理想AD Max体验比起7月份首次使用OTA 6.0的无图NOA能力简直有天壤之别,即便和两个月前OTA 6.4首次切换到端到端+VLM相比,都更加丝滑、值得信任。
相比于此前的版本或者其他品牌的智驾系统,我们在体验过后认为理想汽车的全场景端到端已经真正意义上脱离了模块化、规则驱动的范畴,很大程度上接近了类人的思考模式——当遇到博弈场景时,它的应变不再只是策略上的激进或保守,而是灵活且机动地选择最优的路径,单就这一点给用户带来的安全感和信任感就是目前国内智驾系统中绝无仅有的存在。
截至到OTA7.0的阶段,理想汽车可以说是完全实现了全场景智驾能力,不管是城市、高速环路还是高速路,我们可以一键智驾无断点跨越城市与高速,甚至是跨城。到这个阶段,也就几乎无限接近L3的阶段了。
在2024理想AI Talk中,郎咸朋就提到,L3的前提是实现“车位到车位”的智能驾驶,所以按照目前的速度迭代,他们是有希望在2025年实现L3。他们团队发现L3并不是L2的延续,而是L4或者自动驾驶的先导程序。因此,理想汽车是锚着未来的自动驾驶能力去研发、去成长和迭代的,而不是沿着过去一套用L2的思路、去做现在的自动驾驶。
03
全场景端到端+VLM改变了什么?
理想汽车能够在短短八个多月的时间,就从智驾领域的局外人直接进入到核心圈、成为全球范围内智驾第一梯队,到底有什么启发呢?
驾仕派认为理想汽车给出了几点启示:
第一、智驾技术必须要掌握在自己手里,才能通过“数据飞轮”的方式提升自己的智驾能力,这样也会驱动销量增长;
第二、2025年之后的豪华品牌车型除了在三电技术要领先之外,自研智驾是必须的能力,否则无法支撑起豪华品牌的溢价,这势必也改变了2024年以后豪华新能源汽车的竞争逻辑;
第三、中国车企在智能化技术的投入必须是更多投入在人工智能上,才能推动行业创新、解决行业内卷。
先来讲理想汽车是如何在八个月时间实现智驾领域实现“技术飞跃”发展的。
“人工智能的三个要素:算法、数据和算力。这三个要素必须全都齐备。”郎咸朋解释说之前理想汽车没办法做端到端的原因就是既没有足够的算力,也没有足够的数据。
转折点是2024年年初,理想AD Max车型的销量起来了,高质量训练数据量达到10亿公里左右规模、能够获得300-400万Clips,这是一个基础。其次是算力基础,2024年年初理想汽车算力达到5EFLOPS。再加上原本理想汽车就已在预研端到端,因此从4月份之后理想汽车在智驾能力上说是“一日千里”并不为过。
事实上,理想智驾水平突飞猛进的另一关键在于他们从一开始决定使用 “纯数据驱动”的迭代方式,利用Scaling Law(规模效应)不断迭代和提升自驾能力,以适应所有可能的驾驶环境。
根据理想汽车给出的信息,从7月份千人团开展内测以来,仅几个月的时间里,以每周更新两个模型版本的频率、端到端模型迭代超过30个版本。截至2024年12月31日,理想汽车2024年度智驾里程已达17.2亿公里,智能驾驶累计用户超过100万人。
这也就形成了一个有趣的“飞轮” :用的人越多、高质量数据就越多、智驾能力就提升越快,消费者就更愿意买AD Max的车、这又进一步让提升了理想的智驾能力,从而进一步驱动了理想汽车的销量。
按照理想公布的数据,2024年2月AD Max车型交付量占比大概在20%左右,到2024年下半年超过50%,而这个占比提升的转折点就是理想汽车在7月份推出了端到端智驾的内测。
其次,为什么说只有把智驾自研能力掌握在自己手上,才能成为新时代的豪华品牌。
在2024年一个很明显的变化是,在各家发布会上反复提及成为新趋势的端到端,正在悄然成为普通消费者在选购车辆时必须要纳入考虑的关键因素,消费者更愿意为高阶智能驾驶买单了。谁做得更好、谁更领先,谁就有机会成为最热门的选择。
过去几年,很多人认为理想汽车产品的核心竞争力是冰箱、彩电、大沙发和舒适家庭用车的概念,在2024年年底也出现了被各家车企反复“抄袭”的理想造车范式——从外形、大屏,再到增程。
如果理想汽车的护城河只是这些依靠供应商就能解决的卖点,那么理想汽车无论如何也无法让销量持续向好,更不能维持豪华新能源品牌的定位。所以你也可以理解为什么李想在2024年年初对理想智驾团队“发火”,要求理想智驾团队拿到智驾头部位置。
显然,理想汽车的智驾团队做到了,几乎只用了一年时间就完成了从NPN(先验信息)、到无图架构、再到“端到端+VLM”的双系统技术方案的三次技术迭代,并且还选择了one-model方案,让模型迭代上更快。理想汽车迅速和华为、小鹏、Momenta等先发企业站到了同一起跑线、甚至还率先全量推送车位到车位、高速端到端等功能。
可能很多人忽视的一点是,由于理想智驾团队的全栈自研优势,能从路上跑的几十万辆、如今是上百万辆自己品牌的车里面拿到足够多的高质量训练数据,有自己的算力中心,也能够迅速迭代模型,对用户需要的功能及时升级或调整。
换个说法就是,今后自研智驾的能力就像是BBA曾经各自“秘而不宣”的底盘调校能力,决定了一个新能源车企的品牌溢价能力。
这使得理想汽车在2025年核心竞争从“移动起居室”就变成“领先的端到端智驾能力”,而这是其他车企短时间抄不来的。或许明年大家再去问理想车主为什么选择理想时,“全场景端到端+VLM”将成为他们口中的高频词语。
最后还可以从理想汽车在2024年这场“智驾突围战”中得出一个结论:中国车企要在全球范围内取胜,还是要在人工智能上投入更多的研发资源,才能从当前的电动车优势走向下一个阶段的智能车优势。
实话实说,在过去很长一段时间里,很多人一样认为中国智驾领域的绝对头部车企就是华为,最多再加上一个小鹏,而它们要追上特斯拉似乎也都很远。而随着理想从6.0一路升级到如今的7.0版本,每一个AD Max体验者除了会震惊其进化幅度,以及更愿意且安心地去体验智驾带来的便捷之外,内里对中国品牌在智驾领域的固有排序肯定已然发生了改变。
理想汽车在智驾上的成功似乎出人意料,但又情理之中。大量的研发资金、人员投身其中,时刻紧跟全球这一轮最大的科技浪潮。虽然我们看到的是在短时间内,理想汽车运用人工智能研发成果飞速,但看不到的是理想内部在2023年初就开始研究AI、在那时候理想内部就开始研究Transformer模型、预研端到端技术、开始思考“软件2.0”……换句话说,理想汽车在今天能够拿出全场景端到端不是偶然,而是已经做了很久的准备,只是之前还没有到爆发的时机。
理想汽车在人工智能领域开辟出了一条全新发展的道路、也指明了转型人工智能企业的战略,对于大部分车企来说也同样可以“模仿”理想转型人工智能企业,毕竟“观察理想、学习理想、成为理想”已经成为了业内的一个段子。
更关键的是,让汽车产业转向人工智能产业也不可能靠一个企业的投入就能拉动的,而是需要无数企业一起投入、一起研究、共同学习才能完成,就好像中国电动车产业的成功是从车企到供应链的一起努力。一个理想每年投入约50亿元做人工智能,那么十家中国车企投入进来可能就是500亿元,这将完全改变中国车企在人工智能领域的影响力。
对于中国汽车产业来说,人工智能所带来的发展机会远比电动车更加广阔,在中国电动车成本已经“卷无可卷”之后,只有通过人工智能去驱动智能技术的迭代、才能为全球消费者带去全新的价值体验。从智能助手到智能驾驶再到基座大模型,一旦中国车企率先投入、那必然有机会树立全球的智能车新标准。
李想是这么认为的:“过去我们认为全世界最好的汽车是德国人制造的,但今天,中国企业和一家特斯拉提供了全世界最好的智能汽车。在人工智能方面也一样。只要我们不放弃,所有的人每天去努力,把所有的心思和精力用在去改变这些能力上面,去投入,结果一定会变得非常好。”
(END)