11月底的2024 绝影实力AI DAY活动上,身兼商汤科技联合创始人、首席科学家和商汤绝影CEO的王晓刚表示:“我们已经站在AGI时代的门口,商汤绝影将牢牢把握住新一轮智能汽车变革的时间窗口。”
基于这一逻辑,商汤绝影在本届绝影实力AI DAY上全面展示了“驾-舱-云”三位一体的通用人工智能(AGI)产品体系与战略布局。
在智能座舱方面,商汤绝影行业首发了大模型创新产品“A New Member For U”(你的家庭新成员)。该大模型智能座舱能全面感知用户的语音、表情、手势以及环境数据,并进行深度理解和推理思考,具备理解世界、理解人类的能力。该大模型所搭载的国内首个“车载类人记忆框架”,可以让车机系统实现类人的记忆能力。
(商汤科技联合创始人、首席科学家、商汤绝影CEO 王晓刚)
智能驾驶方面,商汤绝影构建了“车云一体”的产品矩阵,发布了涵盖高速、城区以及泊车等全场景的高阶智驾、端到端智驾等绝影量产智驾产品体系。同时,商汤绝影还发布了全新升级的“开悟”世界模型,以此打造数据基础设施。
据王晓刚透露,商汤绝影的智驾量产交付也在稳步推进中。基于地平线J6平台的智驾方案预计在2025年第二季度开启量产交付,而量产端到端智驾方案则预计会在2025年底量产落地。
借本届绝影实力AI DAY活动,王晓刚与包括百度有驾在内的少数核心媒体进行了现场交流。在此次交流中,他分享了自己关于大模型、智能驾驶行业发展未来等多个维度的思考。
相较于大模型,过去的小模型时代只能针对特定的任务进行解决。据王晓刚透露,截至2021年年底,商汤科技制作的商业化小模型就超过了2万个。如此庞大的小模型,主要是因为他们需要针对不同的客户、不同的任务做各种定制化。
由于小模型时代的一个模型只能解决特定任务,所以整个技术方案的通用性就相对较差,在人机交互领域也只能当作特定的工具进行使用。在自动驾驶领域,意味着每个小模型只能应对特定的场景。想要实现更好的体验,就需要大量堆积小模型。
大模型出现之后,单个模型的通用性将变得更强。这意味着,模型本身可以不再受于特定的任务限制。这是对人机交互方式的一种变革。
在智能座舱领域,大模型正在从工具属性逐渐成长为助理属性。助理,意味着用户可以给大模型提要求,它会在一段时间时间后给到用户反馈结果。
据王晓刚预计,未来的智能座舱模型就像家庭的成员一样,会主动关心用户,并且有记忆、可成长。这也是商汤绝影为何将旗下智能座舱大模型创新产品命名为“A New Member For U”的原因。
作出这样的判断,也是因为商汤绝影发现大模型技术在近年来取得了一些新的突破。
在此前的人机交互中,视频信号和语音信号是分开进行处理的,最后做一个简单的连接。然而,OPEN AI在2024年5月发布的GPT-4o引入了流式多模态可全方位感知人的语音、图像状态,让人机交互的方式和流畅度有了巨大提升。
端云结合的模式,也给了汽车智能化更大的想象空间。
此前,模型需要一直跑在车辆自己的芯片上。因为只有跑在终端芯片上,才能理解、提取车辆的遭遇过的个性化场景。如今,有了端云结合的模式,可以让用户向云端发起请求,提升模型的上限。
商汤绝影开发的New Member本身就是端云结合的架构。在该架构中,涉及到手机APP应用、外部生态调用等维度的内容,可以放在云端。但涉及到隐私保护、个人的空间等方面的数据,则仍然放在车端解决。
在智能驾驶领域,大模型的出现,也让行业发展逻辑发生巨大变革。此前,智能驾驶技术的竞争主要在于算法、芯片、垂直整合能力等维度。
在过去,车企与智能驾驶方案提供商的合作中,通常采用的是模块化分工模式。在这种模式下,车企提出功能要求,Tier1负责集成相关功能,并将一个黑盒进行标准化交付。
王晓刚认为,这种模块化分工模式,将来就很难存在了。未来的端到端自动驾驶时代,更多需要依赖数据的驱动。而数据就在车企的手里。谁能够更接近数据,谁才能在未来的发展中占据主动。
端到端需要用一个模型把原来的多个模块整合在一起,协作和分工模式就会发生变化。智能驾驶供应商不仅要提供基础算力、数据平台化能力、工具链,还要能对齐数据生产的标准和算法的架构。否则,不同车型上的数据将无法兼容。
在王晓刚看来,把各项数据标准和架构打通,相当于给“数据石油”搭了一个坚实的、高质量的数据生产管线,让有价值、高质量的数据从这个“油田”里面源源不断地输出,最终为产品提供强大的动力。
比如,奇瑞这样的大型汽车集团,旗下的量产车数量非常多,每年还有很多车型要推新款。如果智能驾驶方案商可以跟车企自研团队在数据、工具链、算法架构上对齐,很多合作就可以变得更加灵活,交付效率也会更高。
如今,智能驾驶相关供应链整体距离实现盈利还有一定的距离。
据王晓刚预计,智能驾驶供应商想要实现盈利,至少还需要三年左右时间。这三年,企业需要解决两大维度的问题,一个是规模,另一个是效率。如果各方资源和数据工具链无法对齐,往往会造成大量重复投入,对开发和交付效率也会带来负面影响。
截至目前,商汤绝影在大模型相关技术方面的投入已经超过100亿元,并将在未来持续发力。虽然当下在智能座舱领域的出货量更高,但该公司仍计划在未来一段时间将更多的研发资源投放在智能驾驶领域。这种选择一方面是处于技术难度的考虑,另一方面也是基于对未来市场机会的判断。
当然,商汤绝影也并非一味增加投入。在优化成本方面,该公司也已经在2024年对组织架构进行了调整。
王晓刚表示,公司之前的项目相对分散,未来的客户会更加聚焦,产品结构也变得更加明晰,更加聚焦量产。其中也包括本届绝影实力AI DAY发布的基于J6E和J6M的智驾平台、端到端等。
随着大模型技术的快速发展,在王晓刚看来,整个汽车智能化产业的竞争格局也有可能发生变化。
此前的智能化产业发展存在一定的不合理之处,比如全产业链亏损,大批企业在做重复性工作。与此同时,技术的复杂度提升,数据处理的成本提升,意味着即便是车企也很难真正完成全栈自研,给了供应商新的机会。
借助这一重要发展时机,商汤科技正在努力和奇瑞汽车旗下智能驾驶公司大卓智能等更多客户进行全方位对齐。
王晓刚表示,只有与车企伙伴进行全方位深度合作,共享大算力与大模型,共建数据基础设施,共同打造智能汽车大模型创新应用,才能携手共赢。这种对齐不止是要求标准、架构等方面的一致,也包括建立更大的方案集合,便于在数据采集时把客户需要的数据包含进去,减少重复采集和标注的成本。
可以说,未来的汽车智能化竞争是数据的竞争、标准的竞争、效率的竞争。王晓刚预计,谁离数据最近,谁的数据基础设施最强,谁能把数据基础设施铺到主机厂,谁就能在未来竞争中掌握主动权。