学习完郎博的微博内容,大致理解了理想为什么这么坚决选择 VLA 路线,底气主要来自两个维度:第一,数据的「质」与「量」。- 150 万辆在售车每天产生的真实驾驶数据,这个规模的采集效率不是一般数据采集车能比拟的。- 世界模型在云端用几 E flops 的算力做仿真测试,能生成极度逼真的训练样本。这种「真实数据+仿真数据」的双轮驱动,让 VLA 有了持续进化的养料。第二,生成式 AI 的范式革命。VLA 本质上就是「用 GPT 的方式做自动驾驶」——不再是传统的规则叠加,而是让模型自己「理解」物理世界,生成轨迹和控制信号。用户反馈中出现的拟人化行为(比如偏一侧行驶、不严格卡限速),恰恰证明了模型已经开始涌现出对真实驾驶习惯的认知能力。郎咸朋用了一个比喻:再强的大脑,配上高度近视的眼睛和僵硬的身体,照样开不了车。这说明具身智能的本质——各模块必须协同。理想的全栈自研覆盖了感知(激光雷达+视觉)、模型(VLA)、操作系统、芯片、底盘控制等各个环节;甚至连 VMM(车辆运动管理)都会针对自动驾驶信号做精细化调校,区分卡钳制动和液压制动的使用策略。这种软硬件深度耦合的打法,确保「大脑」的决策能被「身体」精准执行。另外,具身智能的两条腿:汽车与人形机器人——李想提到的「两种形态」并不是随口一说。理想当前的 VLA 不仅要服务现有车型,更要为未来的汽车类机器人做技术储备。本质上,自动驾驶就是「车轮上的具身智能」。一旦在复杂交通场景中验证了 VLA 的泛化能力,向人形机器人迁移也就顺理成章了。换个角度看,理想不是在造一辆「会开车的车」,而是在打磨一套「能在物理世界自主行动」的通用智能系统。这套系统的成熟度,将直接决定理想在具身智能时代的竞争位次——这才是郎咸朋强调「系统能力」的深层逻辑。理想高管回应王兴兴质疑
