相比于新车,今年成都车展期间,智驾技术似乎更居C位。无论是在新车发布会,还是成都车展期间很多车企的传播重点,都明确了一个核心:
端到端。
图源:网络
成都车展前,小鹏在15万级车型上落地了砍掉激光雷达的高阶智驾,端到端、纯视觉、技术下沉仿佛又将技术进步的脚步推进了一大步。
图源:网络
集度CEO夏一平向行业发出警示:没有500亿做不好智驾,如果有人说可以花几十亿元做出来智驾,可以说都是马路杀手。
图源:网络
理想汽车智能驾驶研发副总裁郎咸朋博士则表示,从技术架构上,理想最新的方案和特斯拉没有太大差别,甚至更领先一点。
但与此同时我们也发现,在各家都在表达着自己端到端技术先进的同时,对于端到端技术本身,彼此之间还存在着不少争议。
而这,也恰恰代表了中国车企在智驾技术的一个必然阶段:相比于技术路线的统一,车企更追求,如何印证自己的技术先进性更适合中国市场,并率先抢占用户心智。
中国的端到端到了什么阶段?英伟达CEO黄仁勋在接受外媒采访时,曾将特斯拉第12版全自动驾驶技术总结为:它是一个端到端的生成模型。
相比于特斯拉,中国车企们的技术路线向端到端转移大多数是从去年底今年初才开始的,这意味着无论是模型的建立还是数据训练,中国车企与特斯拉之间始终存在着一定差距。
夏一平警示行业,激进的端到端肯定会有安全隐患。目前,极越采用的是两段式端到端,也就是感知和规控分为两个模型来做。
相比于极越,理想走的是OneModel端到端,通过直接传感器输入,模型推理完毕后直接给到轨迹规划用来控车的一体化端到端模式。
与此同时,理想还加入了能为端到端系统提供辅助的VLM技术架构——一个具备兜底和泛化能力的视觉语言模型,也就是说,理想的端到端,是一种双系统结构。
对于这一技术路径,理想则认为,一体化端到端本身想解决中间信息的损失,如果中间加了人为的信息消化过程,可能效率不是那么高或能力上限受到约束。
号称全球唯二实现端到端大模型量产落地的小鹏,也有了新动作,在小鹏MONA M03上市时宣布了一个重磅消息:自研的图灵芯片流片成功,并号称其计算能力是现有芯片的三倍。
这是成都车展期间,关于端到端非常具像化的三家企业,在技术演进的同时,三家企业也不约而同地发出了警示行业的言论。
当然,尽可能印证自己技术的安全性与先进性,才是核心议题。
端到端最难的是什么?对于智驾的高投入,理想也比较认同,并且他们都认为,数据和算力是端到端高投入的主要原因。
极越智能化产品线负责人潘云鹏在讲到如何判断端到端的能力时,提到了三点:
第一个是数据,这取决于路上的车,以及数据的质量;第二个是算力,云计算中心端有多大的规模;第三个是算法模型。
而仅仅是算力,就非常考验车企的投入。
夏一平举了一个例子:特斯拉刚刚建成的算力中心花费280亿人民币,其中日常运营成本中,一年的电费就是10亿人民币。
理想更认为,人工智能需要大量的数据和算力,会让具备高阶智驾车辆保有量以及充足研发投入的企业,在智能驾驶方面的优势增加,并且实实在在地促进销量提升,而销量提升又会带来保有量和研发投入的提升,这是一个不断正向滚雪球的过程。
而小鹏则把AI大模型的竞争推到了一个新的level:何小鹏称,立志做AI的公司都会有专用的AI芯片的研发。
图源:网络
无论是算力还是研发投入,端到端的长线投资对于以技术为核心的车企来说,都将是最现实的考验。
夏一平说,没有500亿做不好端到端。
何小鹏宣称,每年要投35亿元到AI业务当中。
理想郎咸朋说,理想现在5.39亿EFLOPS的算力,到今年年底预计8亿EFLOPS,一年就要消耗20亿人民币。未来进入到L4阶段,每年数据的增长和算力的增长,都是呈指数级的增长,这也就意味着每年至少需要10亿美金。
中国车企想成为智驾普及者,第一关就是长期持续的高投入。
对于用户来说,什么是好的端到端?无论是技术路径还是研发投入,最终用户只看体验。是否有图无图,采用什么模型,大多数用户其实并不关心。
但是从技术开发者角度而言,却是一个复杂的问题。
比如如何实现快速迭代。理想建立了世界模型,具备模型测试能力,对端到端模型进行训练。
比如如何保证安全。夏一平在谈到体验一些友商的产品时发现,有些功能一看太牛了,但突然到一些很简单的场景却没有办法执行,因为它的随机性实在是太高了,下限确实低起来很可怕,没有安全的意识。
比如小鹏打造20万以内高阶智驾第一车的同时,其自研的图灵芯片要跑包括端到端的自动驾驶等在内的不同大模型,,要面临很多挑战。
成都车展前,同济大学汽车学院教授朱西产为国内端到端泼了一盆冷水。他说,
“端到端被特斯拉带火了,国内车企都在说端到端,但现在,谁宣布端到端(量产上车)了,他的这个车你就别买。”
图源:网络
车企力推端到端,专家打假端到端,用户不懂端到端,这也恰恰印证了端到端本身,在中国市场还将是一场需要长期实践的证明题。