理想智驾“豹变”

衣衣谈汽车 2024-11-02 08:54:51

在中国智驾军备竞争全面升级之际,理想AD Max高速冲到前排。

2024年10月23日,理想汽车发布OTA 6.4。

这个升级,意味着该公司基于「端到端+VLM」的智驾系统,可以被AD Max全量用户使用。

这次迭代,使得理想成为国内第一家把端到端智驾系统推给全量用户的车企,率先进入AI大模型时代。

在OTA之后,理想AD Max用户可以愉快地使用城市NOA功能,包括自如进出环岛,熟练地U型掉头,高效地在复杂的红绿灯路口与人车博弈,遇到有车辆占道,果断绕行……

一些特色功能包括:

能够识别公交车道的禁用和可用时段,能够识别坑洼路面并绕行,能够识别减速带并减速。

在设置好目的地之后,哪怕是P挡在路边的停车位上,也可以直接激活理想AD Max系统。

在实现端到端模型全量推送之后,理想AD Max,在城市NOA场景、包括AEB、AES等主动安全场景,以及自动泊车、代客泊车场景,无论从任何一个角度进行衡量,都无可争议地进入了国内智驾的第一梯队。

据理想汽车提供的数据,30万元以上的订单中,有70%的用户会选择AD Max版本,理想L9 AD Max订单甚至超过了80%。

和5月份相比,理想L7、L8和L9的订单中,AD Max版本的占比增加10个以上的百分点,理想L6的订单中,AD Max的占比提升了6个百分点。

高阶智驾系统,正在显著影响用户的购买决策。

决战智驾

理想智驾战略的转折点是2023年秋季的雁栖湖会议。

2023年9月25日,理想汽车秋季战略会在雁栖湖畔的凯宾斯基举行,当天下午的一个专题议程之一是关于如何看待智驾。

就是否大力投资智驾这个问题,理想汽车的高管争吵得非常激烈,外部专家的批评的意见也无比犀利。

2023年的秋季,正是理想汽车如日中天的时候,这家蒸蒸日上的企业,是否需要进行一次巨大的“核心战略转型”?

对于绝大多数车企而言,在顺境中,特别难以听进不同的意见并做出改变。

对于理想内部的高管们而言,Pro版本依然非常受欢迎,尤其是下沉市场,对于价格的敏感度非常之高,Pro版本备受欢迎。

另一方面,小鹏G6、问界M7等车型的智驾版本开始受到市场的欢迎。人们对理想在智驾方面的“不思进取”感到担忧。

如果从事后诸葛亮的角度看,我们很容易可以得出结论:

高阶智驾系统,将会在接下来12个月,从根本性上改变人们的用车体验。

主动安全系统,将会让人在黑夜无灯状况下,哪怕是时速达到120km/h,也能够实现紧急刹停。如果不能刹停,甚至可以实现自动转向避让。

人们在倒车时,在正面、后面、侧面的任何一个方向,遇到任何视野盲区的障碍,AEB系统都可以主动刹停。

基本上,当所有的智驾系统标配之后,我们可以永久性地避免倒车时撞上儿童的惨剧。

此外,油门当作刹车的意外永远不会发生了。

对于女性的司机而言,泊车再也不会是一个问题,她们可以选择离车自动泊入,可以选择跨楼层代客泊车,可选择召唤车辆出停车位,强大的AEB功能可以确保在泊车过程中不会发生碰撞。

最重要的是,城市NOA终于从PPT之中变成现实,不仅是有,而且是真的可以用了。这对于精力不济的中年男人而言,将会极大地缓解驾驶疲劳,避免通勤过程中的事故的发生。

AI已经从根本性上改变了汽车。

但是,在2023年的秋天,理想汽车的高管们对智驾发展的节奏,并不能做到未卜先知。

人们对智驾的重要性没有疑问,对智驾的终局也没有疑问,唯一的问题是,节奏。

在激烈的争吵中,李想问了一个问题,他请所有与会者做出一个判断,即在2025年12月份,在20万元以上的NEV车型的销量中,搭载能够支持城市NOA系统的车型销量占比大概会达到多少?

在经过激烈的分组讨论之后,绝大多数的预测指引落在了80%这个区间。

另外一个用以辅助的判断是,在2025年12月份,支持城市NOA的硬件成本会降到多少?

当时的判断是,有不小的概率逼近1万元。

对于所有的玩家而言,智驾的规模化落地节奏,正处于一个tipping point:一方面,用户的使用体验正在突破临界点;另一方面,智驾产品的硬件成本随着规模的快速扩张,正在急剧下降。

这也就意味着,智驾系统对用户购买决策的影响将会持续提升,并会形成一个飞轮效应,导致强者越强。

尤其是对于30万元以上的车型,智驾对购买决策的影响会更加显著。

2024年的这个夏天,上述判断都已经被一一验证。

随着价格的下压,在20万元-30万元的价格段,预计智驾将会在比较短的时间内成为影响购买决策的重要因素。

在经过这些探讨之后,理想汽车给出的判断是,在接下来的24个月左右时间里,城市NOA将成影响新能源汽车市场格局中最重要的因素。

于是,在最快的时间之内落地城市NOA上升为理想汽车公司的核心战略,无论是重要性,还是紧迫性,这个判断均能成立。

对于理想汽车战略负责人张辉而言,这又是一次开的“稀碎”的战略会。

由于智驾战略重要性陡然上升,李想当时就决定打破会议既定流程,集中力量研究如何在组织、资源和流程上保证智驾战略的落地。

这次会议的关键决策,决定了在12个月份之后,当中国市场爆发激烈的智驾军备竞赛时,理想汽车迅速从跟随者冲到了领先者的位置。

智驾豹变

理想这家组织,一旦战略确定之后,其组织迸发出来的执行力是惊人的。

在接下来的12个月又28天的时间里,理想汽车将会通过三种智驾技术路线,即NPN神经先验网络、无图城市NOA再到「端到端+VLM」,在主动安全、泊车和城市NOA三大场景中实现产品体验的突破。

2023年9月25日,该公司将智驾定为核心战略。

理想智驾突围第一阶段的突破口在主动安全和泊车场景,城市NOA主要还是处于跟随状态。

2023年12月10日,理想汽车发布了一次重大的软件升级,即OTA 5.0。

这次升级,该公司将智驾系统迭代到AD Max 3.0版本。

在这个版本中,理想汽车依托NPN神经先验网络,在100个城市落地城市NOA。

当然了,在城市NOA赛道,彼时的理想智驾依然处在追赶阶段。

在那个版本,理想AD Max所取得的突破是在AEB领域,即将AEB工作速度范围提升到了4-135km/h,使得AEB工作速度范围首次超过友商,AEB最高刹停时速达到了120km/h。

基本上,理想智驾的AEB能力进入行业第一阵营。

2024年2月3日,理想汽车发布了OTA 5.0.4版本。

在这个版本,理想AD Max在代客泊车场景取得突破,释放了地下停车、地上停车场的跨楼层记忆泊车。

在笔者自己做的对比测试中,理想AD Max跨楼层记忆泊车的好用程度已优于主要竞争对手。

2024年3月30日,理想汽车发布OTA 5.1.0版本。

在这个版本,理想智驾在代客泊车和主动安全场景实现新的里程碑。

在自动泊车方面,大幅优化了离车泊入功能。

在AEB场景,新增了左、右转弯时,对横穿行人、自行车的紧急制动,使得AEB功能体验在竞争中保持领先,并实现了巨大的用户价值。

此外,理想AD Max首次推出了“紧急避让”功能,如果驾驶员因为疲劳或分神的原因,车辆偏离当前车道时,若与侧方车辆、侧后方超车车辆、逆行车辆之间存在碰撞风险,车辆将自动纠偏,控制车辆回正至安全的原车道。

这项能力,发展成后来的AES,即主动安全的另一个赛道——车辆紧急转向。

在城市NOA场景,理想汽车的主攻由OTA 5.2.0版本开始发起,核心标志是在技术路线上开始从NPN神经先验网络切向无图城市NOA架构。

2024年5月11日,理想汽车发布OTA 5.2.0。

在OTA 5.2.0这个版本,里程碑依然来自于主动安全领域,包括新增了前向/后向横穿紧急制动功能(FCTB/RCTB)。

至此,在主动安全功能上,除AEB之外,理想智驾系统,在所有功能上,基本追上主要竞对。

在主动安全、泊车两大场景实现突破之后,理想开启发力难度最大的智驾场景——城市NOA。

从这个版本开始,该公司城市NOA的技术路线开始向无图路线进行切换。

在OTA 5.2.0发布的前一天,理想汽车已招募了1000名无图NOA的早鸟用户。

2024年6月11日,理想智驾无图NOA再次新增9000名早鸟用户。

2024年7月5日,理想汽车举行夏季发布会,核心内容是发布OTA 6.0。

在这次发布会中,理想汽车宣布无图城市NOA将于7月15日起,开始向全量AD Max用户推送。

同时,在智驾技术路线上,理想汽车从NPN神经先验网络切换到了无图模式,即在感知上通过神经网络来识别外部世界,摆脱了对高精地图的依赖,实现了有导航的地方就能够激活NOA智驾系统。

在发布会中,理想汽车提出,该无图NOA系统,“真正做到哪里都能开。不限道路,不限城市。偏僻小城窄路、乡村小路、错综山路等都能流畅通行,无车道线、临时施工路段都不再是问题。”

在城市NOA的竞争中,理想AD Max成为国内第三家实现了向全量用户推送的、所有城市都能开的智驾系统。

在主动安全方面,理想AD Max的AEB首度实现了夜间无灯场景,在120km/h时速下的AEB紧急制动功能。

此外,主动避让功能正式升级为AES,即哪怕因为距离过短不能有效刹停,车辆也可以自动转向换道避让。

这个功能属于行业首发,将主动安全水平卷到新高度。

在低速泊车场景,理想AD Max实现了前向、后向、侧向的人、车、障碍的碰撞紧急制动。

7月5日的发布会上,理想汽车对外发布了智驾新技术路线「端到端+VLM」架构。

如果说,无图城市NOA的全量推送,意味着理想智驾在城市NOA赛道上追上了行业领先水平的话,「端到端+VLM」架构的推出,代表了该公司试图在智驾上引领行业的决心。

7月31日,理想“端到端+VLM”智驾系统开启招募千人体验团。

8月30日,在成都车展,理想汽车“端到端+VLM”智驾系统开启招募早鸟用户万人体验团。

2024年10月23日,理想汽车发布OTA 6.4,行业首创的「端到端+VLM」智驾系统开启全量推送。

在这次更新中,理想AD Max增加的功能包括:

1.环岛通行,属行业领先水平。

2.U型掉头,与友商能力持平。

3.路边P挡激活,属行业领先水平,目前友商的逻辑是在D挡和Autohold情况下可激活。

4.升级绕行能力,提高通行效率,属于行业领先水平,遇到路边有临停车辆占道时,绕行能力强于友商。

5.升级复杂路口通信效率,属于行业领先水平。

6.识别限时公交车道,潮汐车道,属于行业首创。

7.识别减速带,提前减速,识别坑洼路面提前绕行,属于行业首创。

不一一赘述。

据理想汽车透露,该公司从2024年7月5日开始,发布第一个「端到端+VLM」智驾版本,到10月23日向全量用户推送,在110天时间里,一共迭代了30个版本,每3.7天迭代一个版本。

「端到端+VLM」架构的落地,充分体现这家造车新势力的做事方式。

理想模式

理想汽车投资人王兴对李想的一个重要评价是“think different”。

包括早期的SEV、增程的理想ONE、L系列和标新立异的MEGA,这里有得有失,但整体上看,得远大于失。

敢于做不同的东西的基础,是对事情有深度的洞察,然后才能做出那些真正意义上的正确而又非共识的决策。

在智驾突围战中,李想从来没有想过以堆几千人来解corner case的方式与友商竞争,他希望找到适合理想汽车特点的解决方案。

对于理想智驾突围战而言,最重要的一个决策就是技术路线的选择,即后来的“端到端+VLM”模式。

对于重图、轻图和“无图”这个事情,从用户体验的角度而言,车企几乎都能快速地确定“无图”是未来的方向。

这里除了政策在审图方面的因素之外,快速更新是另外一个几乎不可能完成的任务。

另一个挑战是,智驾系统如果必须依靠“高精地图”这个拐杖,这无法实现真正意义上的泛化,哪怕在中国可以,在其他国家也不行。

这就是理想早期试图通过NPN模式解决一些复杂路况的有效智驾时遇到的问题,无法泛化,运营的成本高到无法承受。

接下来更大的问题是,实现无图城市NOA,解决方案到底是以规则为主,还是以模型为主?

在早期,理想汽车的智驾在解决无保护左转时,找了很多算法高手,把各种各样的复杂博弈抽象成一些标准的模式和算法,但总是会遇到corner case。

收集到corner case之后,加入新的规则,继续训练、验证,投入使用。然后,又遇到新的corner case,周而复始……

这个时候的智驾系统,并不是本质上的智驾系统,而是一个“自动机”,如果之前遇到过这样的情况,且有相应的规则就可以执行,如果没有相应的规则,就不能执行。

李想认为,人们无法穷尽无保护左转所有的corner case,随着时间的推移,规则会越来越多,直到系统不堪重负而崩溃。

后来,理想团队决定试着用小模型来解决问题,结果发现原先需要一个算法高手忙活几个月的事情,半天就可以搞定。

这就有点像,小孩能够自然地感知外部的环境,然后通过感觉和模仿学会走路,但如果要把孩子怎么走路用函数表现出来,这是一个无比艰难的数学题。

在很多时候,近似模拟比精细化的数字控制更有优势。

关于智驾技术路线的选择,李想经常会讲一个他太太学车的故事,在刚学会开车的时候,李想的太太总是剐蹭,不断地剐蹭,无论是大车还是小车。

哪怕一个一个场景解释应该怎么开,依然会剐蹭。

后来,李想给他太太报了一个“宝马驾驶训练课程”,在一天的课程中,教练只教两个事情:

1.教如何看路。在各种复杂的场景,教司机聚焦于看要去的地方,而不是看各种复杂状况。

2.教如何踩刹车。即在各种复杂场景,如何有效地做好制动。

在这之后,李想说,他太太告别了开车剐蹭。

从这个案例中,李想得出的结论是,人学会驾驶,不是去学习各种复杂场景怎么处理,而是去学习处理复杂场景中最重要的两项基本能力,一个是看路,一个是刹车。

基于这样的思考,李想指出,真正的智能驾驶,一定不是rule-based的模型,而是一个principle-based的模型。

你需要教会模型能力,而不是告诉它什么样的问题应该怎么解决,否则永远做不好自动驾驶。

对于理想智驾技术路线的另外一个启发是一本名为《思考,快与慢》的书,这本书提出,人脑之中存在系统一和系统二,系统一是一个低功耗的高效系统,这个系统把一些经常性发生的事项,比如说走路、吃饭、开车的应对方式模式化,一旦进入到这些场景,系统一就会接管,会非常高效和轻车熟路地“自动反应”。

系统二则是一个能力更强的,能耗更大的思考系统,如果遇到一些特殊和复杂的事项,系统一处理不了时,系统二就会上线,进行思考和推理,试图解决问题。

人脑的运行机制,被李想应用到了智驾系统的技术决策之中,他们认为,绝大多数的场景,智驾系统均可快速响应和处理,这类似于人脑的系统一;在一些复杂的场景,比如说环岛、复杂红绿灯场景的博弈,一些更特殊的情况,系统一没有见过的话,这需要引入系统二,进行思考推理和决策。

基于对人脑解决问题架构的思考,理想汽车最终将该公司智驾系统的技术路线确定为“端到端+VLM”的结构。

端到端系统相当于人脑中的系统一,低功耗但快速地解决大多数常规驾驶中遇到的问题。

VLM相当于人脑中的系统二,在智驾系统遇到一些比较困难的场景时,系统二会上线,给出解法。系统的响应速度会慢一些,但能力会强很多。

系统一和系统二的特点,也反应在了「端到端」系统和「VLM」系统的参数规模和响应频率上。

相同的算力,端到端系统选择的是3亿参数模型,但响应的速度很快;VLM系统选择的是22亿参数模型,但响应的速度略微会慢一些。

技术Vision的获得,需要底层的思考。

底层的思考越扎实,技术的决策就会更坚决。这也是为何,理想始终没有投入大规模的人力参与友商的解corner case的竞赛。

破局的方式不来自于模仿,而是来自于持续思考底层逻辑。

在智驾系统向L4级智能驾驶演进的过程中,相信还会多次出现技术战略的抉择时刻,在这些时刻,车企们需要的,是更底层的思考。

One Model

One Model,是理想端到端模型几乎必然的选择。

One Model的缺点一目了然,难度极大,需要在早期付出巨大的模型架构探索成本。

好处也很清楚:一方面,减少分段式模型之间数据传输时的信息损失,尤其是避免损失掉那些人类意识不到的重要信息;另一方面,减少中间步骤,尽量降低“人工智能”中的人工部分,提升模型训练自动化程度,加快迭代。

一旦One Model模式跑通和进入正轨之后,剩下的竞争,将会进入到比拼数据规模、模型参数规模和迭代速度上。

这样的运营和竞争模式,一方面,符合AI产业的发展规律;另一方面,能够极大地与理想汽车自身的核心优势相结合。

从AI产业发展规律上看,我们至少要有以下几个判断:

1.智驾的竞争是马拉松而不是百米冲刺。或者说,要以接近冲刺的速度跑马拉松。

2012年,辛顿和他的弟子们推出了AlexNet,在李飞飞博士构建的ImageNet图像识别大赛中以巨大的优势夺得冠军,开启了人工智能的深度学习时代。

在这个过程中,AI行业先后经历了AlphaGo、ChatGPT等里程碑,不断经历高峰和低谷,但我们可以很容易地得出一个结论,AGI还在产业发展的初期。

一方面,人们对智能本身的认知依然不够深刻,还难以打造出真正的智能;另一方面,产业链还不够ready,无论是应用还是供应链。

智驾的故事一样曲折。

2012年,谷歌Waymo启动自动驾驶研究,到2024年10月,该公司依然没有实现商业模式的落地。

2016年,特斯拉启动了Autopilot系统的自研,2024年7月30日,特斯拉大范围推送FSD V12.5版本。

FSD V12.5版本在加州表现良好,一旦到了美国东海岸特斯拉车辆保有量低一些的地方,表现就不尽如人意,到中国的挑战显然会更大。

毫无疑问,做智驾的人对智驾前景充满乐观,但我们依然需要对何时实现L4持谨慎的态度,对困难预估的充分一些。

笔者认为,在英伟达Thor和Hardware4.0时代,人们能够实现城市NOA,但很难实现部分场景的L4级智驾。

在Hardware5.0,或者说AI5时代,算力增加10倍的情况下,模型参数规模再增加十倍,也许可以实现部分场景的L4。

更合理的预期是,特斯拉可以在AI6时代,能够在比较多场景中落地L4级自动驾驶。

此外,对于参与智驾竞争的车企而言,实现L4级自动驾驶并不是终点,需要扩大L4自动驾驶的覆盖范围,才能进行更好地商业化运营。

这注定会是一个漫长的过程。

从现在开始到L4级智驾实现有一定规模的商业化落地,时间预估为5-10年会更理性一些。

2.AI训练很烧钱。

在这个时候,GPU很贵,非常稀缺。

据甲骨文创始人拉里·埃里森回忆,他曾和马斯克一起请英伟达的黄仁勋吃饭,恳求黄仁勋尽量多地收走他们的钱,以获得尽可能多的H100。

在马斯克的恳求之下,特斯拉获得了5万张H100的GPU,据博主郑小康披露,截至2024年Q3,特斯拉拥有的等效训练算力达67.5Eflops,2024年12月,预计会增加至88.5Eflops。

在中国,因为众所周知的原因,获得GPU的困难更大、成本更贵。

据36氪报道,2024年下半年,理想汽车几乎横扫了渠道商手里的卡。

2024年7月,理想汽车训练算力为2.4Eflops;2024年8月31日,该公司的算力储备达到了5.39EFLOPS。

一举超过了鸿蒙智驾彼时5EFLOPS的算力储备,2024年9月24日,余承东在智界R7发布会上透露,该公司的云端智驾训练算力已增至7.5Eflops。

据理想汽车负责智驾研发的副总裁郎咸朋透露,到2024年底,该公司的智驾训练算力将会达到8Eflops。

在一两年之内,郎咸朋判断,理想汽车训练算力的需求将会达到100Eflops级别。

说到训练算力的成本,郎咸朋的原话是:“经费在燃烧。”

训练算力的增加,主要来自于模型参数规模的增加、训练样本量的增加和版本迭代速度,这三个因素是相乘的关系。

车端模型参数规模。

特斯拉FSD V12.5版本和V12.3版本相比,由于搭载了Hardware4.0,车端参数规模扩大5倍,相应的训练算力就需要增加5倍。

训练样本数量。

以理想汽车为例,该公司第一阶段的训练样本数量为100万clips,OTA 6.4全量推送的版本训练样本数量为400万clips,意味着训练算力需要增加4倍。

理想汽车的计划是,在2024年底,将训练样本量增加至1000万clips,大致与特斯拉的训练样本量持平。

迭代速度。

你可以一周迭代一个版本,也可以3.5天迭代一个版本,迭代速度越快,用户体验越好。

车端参数规模越大AI模型的能力越强,优质样本规模越大,AI模型能力越强,版本迭代速度越快,AI模型能力提升越快。

以特斯拉为例,从Hardware4.0到AI6,我们预计车端算力可以增加100倍,可以支持100倍车端模型规模的扩张。

假设迭代速度不再增加,clips样本量也不大规模增加,云端算力还需要增加100倍。

郎咸朋认为,到2024年底,理想汽车算力将超过8EFLOPS,每年在训练算力的投入已经超过10亿人民币。最终实现自动驾驶需要的训练算力要达到100EFLOPS的量级,折合成投入每年要超过10亿美金。

3.需要大量的优质数据。

大模型,好的算法,一定要在大量优质数据的训练下,才会获得好的模型能力。

正如AI科学家李飞飞博士指出,AI的发生,本质上是辛顿和他学生的算法,加上黄仁勋的GPU和斯坦福的ImageNet大数据集同时出现时,它才会发生。

理想汽车的研发人员指出,当给端到端模型喂80万clips的数据时,它无法实现U型掉头,当数据规模提升到100万clips的时候,突然就学会了U型掉头。当然了,这些clips必须是优秀司机的驾驶里程视频片段。

一如人的学习,你需要给大脑足够多的优质数据,包括读好书,和牛人交流,以及参与好的实践,才能快速成长。

理想汽车的实践经验是,在所有的司机中,大概有3%的司机的驾驶行为,能达到他们的优质数据的标准。

如果你想获得足够多的优质数据,足够庞大的、能够收集数据的车队规模,是成功的保障。

智驾竞争是一场耗资巨大的长期竞争。

要想在这场竞争中胜出,长期的预算和海量的数据是决定成败的胜负手。

长期的预算和海量的优质数据,都只取决于你能够卖出多少新能源汽车,尤其是搭载高阶智驾系统的新能源车型。

或者说,主要是20万元以上的新能源车型。

首先,油车无法支持高阶智驾系统的落地。

其次,20万元以下的车型,购买者属于极度价格敏感型,极少用户会为一个没有被证明过的智驾系统额外增加3万元的购车预算。

20万元以上价位的购车者,选装智驾系统的意愿会随着价格增加逐步增强。

以理想汽车为例,售价在20-30万元之间的理想L6,AD Max的选装率在30%以下,售价在40万元以上的理想L9,AD Max版本接近80%。

最后,智驾的竞争,依然依赖于智驾模型参数规模的扩张,这需要车端AI算力的不断增加,在短期之内,低端车无法负担搭载大算力芯片的Bom成本。

对于理想汽车而言,在20万元以上的新能源汽车市场,他们依然是中国品牌中的销量冠军,2024年9月份的市占率为14.7%。

尾声

对于一个车企而言,需要在特别关键的事项花更多的时间进行决策,这样才可能把关键的决策做对。

对于任何一个车企而言,都需要找到符合自己企业特色的解决方案,模仿和对标,只有在足够幸运时才能发挥作用。

智驾的竞争之路,依然非常漫长。

0 阅读:12
衣衣谈汽车

衣衣谈汽车

感谢大家的关注