文、图 | 记者 潘亮
2月22日,在上海徐汇举办的2025GDC全球开发者先锋大会上,商汤绝影CEO王晓刚发布了行业首个与世界模型协同交互的端到端自动驾驶技术路线R-UniAD。该技术通过构建世界模型生成在线交互的仿真环境,这与DeepSeek技术创新思路同归一源,从模仿学习向强化学习升级演进,实现端到端模型的强化学习训练。
商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚
会上,王晓刚表示,强化学习可以迁移到端到端自动驾驶领域,降低数据规模门槛,提升模型性能。R-UniAD采用多阶段强化学习训练方法,通过高质量数据冷启动,模仿学习训练基础模型,再通过强化学习提升性能。该技术路线让端到端自动驾驶的数据需求降低一个数量级,有望助力车企合作伙伴超越特斯拉FSD。
商汤绝影现场演示端到端算法与世界模型仿真环境实时交互
商汤相关人士表示,商汤绝影发布R-UniAD技术,分云端训练、强化学习提升、车端部署三阶段。其核心为世界模型“开悟”,能生成高保真数据,支持在线交互。现场演示验证技术可行性,量产方案预计年底交付,已用于数据生产,4月上海车展将展示R-UniAD实车部署。