武汉和深圳上路的“萝卜快跑”,带火了自动驾驶汽车,一夜之间它就来到了我们身边,许多人也在为被神吹的特斯拉FSD而焦虑。那么,中美自动驾驶哪家强?
AI大模型是自动驾驶的天花板
最近,OpenAI在一次全员大会上,推出了全球智能评分体系,并展示了接近人类推理能力的大模型。会上,OpenAI高管告知员工,目前ChatGPT处于L1水平,但即将达到L2-“推理者”,2027年将达到最高级L5。 据说使用斯坦福大学开发的“自学推理者”架构。
华裔计算机科学家李飞飞,2024年4月创办的AI创企“世界实验室”(World Labs),旨在利用类似人类的视觉数据处理技术,使AI理解复杂物理世界和物体关系,获得高级推理能力——空间智能。李飞飞称空间智能是AI新一轮爆点!
我们由此可见:“L2级——推理者”是自动驾驶的最低门槛。自动驾驶的希望在于打开L2通用人工智能的天花板。
特斯拉纯视觉自动驾驶的三大瓶颈
马斯克经常讲:人靠眼睛就能开车,机器靠纯视觉也能开车。
其实,人开车不仅靠眼睛单一视觉感知,还要靠听觉、嗅觉、触觉等多模态感知。老司机最重要的品质是从经验中产生的预见力,能够随时精准处理突发情况。
从实际情况看,目前纯视觉自动驾驶有三大瓶颈,特斯拉FSD也一样。
一是“端到端”AI大模型瓶颈。目前,OpenAI的大模型都还没有达到L2级(推理者)的水平,特斯拉的大模型起步晚,离L2级更远。笔者认为,不懂逻辑的AI大模型开车,如同刚学会开车的菜鸟司机,由于没有像老司机那样的预见力,总觉得处处是坑,稍有情况就不知所措。网传武汉的“萝卜快跑”前面遇到编织袋,就会止步不前。
二是依靠高清地图的瓶颈。目前,在没有高精度地图和其它传感器支持的情况下,纯视觉路线在复杂道路上寸步难行。目前,特斯拉FSD在美国依靠谷歌的高清地图。在中国,已与百度签订高清地图合作协议。
三是纯视觉数据质量瓶颈。特斯拉走的是纯视觉路线,数据只有一个视觉感知模态,是单一维度数据,缺乏多样性和代表性。华为和百度等采用激光路线,有激光雷达、毫米波雷达、超声波雷达、摄像头等多模态感知,是不同来源的多维度数据,而不同来源的多维度数据是可以交叉验证的,可大幅提高数据的准确性和可靠性。纯视觉自动驾驶在雨雾等极端天气下局限性更大。因此,华为和百度等多维数据质量远高于特斯拉单一维度数据。特别是中国的道路人多、车多、路况变化快,华为和百度等拥有自己的自动驾驶训练基地,能够精准模拟极端复杂路况,更能够体现数据的多样性和代表性。特斯拉的FSD是在美国相对简单的环境下训练出来的,难以适合中国复杂路况,而且数据的多样化和代表性严重不足。
“端到端”自动驾驶到底哪家强?
在AI大模型出现之前,自动驾驶系统采用模块化设计——感知、决策、控制三个模块,各模块采用各自的算法模型,其中AI主要应用在感知模块。决策、控制模块还是用算法工程师编写的规则代码,比如红灯要停车、绿灯时可以通行、要在车道中间行驶等等,之前的特斯拉FSD版本中这类代码多达30万行。
但是,AI大模型出现后,就开始采用“端到端”新技术架构。特斯拉FSD V12版本中,决策、控制模块代码减少到几千条。特斯拉的工程师只是不断地让AI学习大量人类的驾驶视频片段,然后AI不仅能自己识别路况,而且涌现出了类似人类的驾驶决策和控制能力。
笔者认为,人工智能主要取决于算法、算力、数据。自动驾驶可简单表示为:
自动驾驶水平=算力✕算法✕数据
目前,中美搞自动驾驶的巨头算力上没有差距,大模型芯片该买的早就买好了,国内华为昇腾910B也已大规模量产,国内大模型算力也没问题。因此,各大公司的自动驾驶主要体现在算法和数据上。
算法主要体现在AI大模型应用上。马斯克离开OpenAI后,才开始自己搞大模型,其新版大模型Grok 3使用10万块英伟达H100 ,年底才出来,由于起步比较晚,算法迭代需要时间。虽然公开报道特斯拉率先搞“端到端”,但是,华为和百度的大模型起步早。华为盘古大模型落地早、应用广泛。2024年6月发布的华为盘古大模型5.0在全系列、多模态、强思维上全面升级,它通过创新的可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。因此,笔者认为,华为盘古大模型5.0超过ChatGPT4o,可以达到L2—推理者水平。
数据不仅要看里程数,还要看质量,特别是多样性和代表性。据美国兰德智库估算,采用单车智能技术,需要累计170亿公里(约110亿英里)以上的测试数据,才能够实现自动驾驶系统的量产。目前,特斯拉累计跑了84.8亿公里,华为跑了2.2亿公里,百度跑了2亿公里。
笔者认为,在没有突破170亿公里这个临界点的情况下,数据质量比数据数量更重要。因此,笔者综合分析认为,目前自动驾驶只能达到L3,华为和百度的自动驾驶可能比特斯拉FSD还要略好一点。
百度称其新版自动驾驶达到L4,领先特斯拉3-5年,因为特斯拉FSD在中国要用百度的高清地图。但是,目前国家批准上路的只有L2。在武汉上路的“萝卜快跑”,按规定必须有人车比不低于1∶3的远程安全员。因为2023年11月交通运输部印发的《自动驾驶汽车运输安全服务指南(试行)》有此明确规定。