2025年2月18日,汽车产业与人工智能领域共同见证了一个历史性时刻。阶跃星辰与吉利汽车集团联合宣布,双方联手研发的两款阶跃Step系列多模态大模型正式面向全球开发者开源。这两款模型分别是当前全球参数量最大、性能最优的开源视频生成模型——阶跃Step-Video-T2V,以及行业首款产品级开源语音交互大模型——阶跃Step-Audio。它们的开源,不仅填补了开源领域在多模态大模型方面的关键空白,更为全球AI技术的创新与普惠发展注入了强劲动力,充分展现了中国汽车产业与AI技术融合的实力与担当。
阶跃星辰,作为吉利汽车集团重要的科技生态战略合作伙伴,拥有一支国际顶尖的算法团队。自2023年起,吉利与阶跃星辰开启深度合作,在预训练大模型、垂直领域大模型、应用场景设计以及工程开发等多个核心领域展开协同攻关。其中,吉利凭借其在汽车场景设计、模型测评和工程开发方面的深厚积累,主导相关业务板块;阶跃星辰则凭借其在模型预训练方面的专业优势,承担起关键的技术研发工作。双方优势互补,共同打造出两款性能卓越的多模态大模型。
技术层面,阶跃Step-Video-T2V大模型以300亿的参数量傲视群雄,能够直接生成204帧、540P分辨率的高质量视频,在全球开源视频生成大模型中独占鳌头。而阶跃Step-Audio大模型同样表现亮眼,它能够根据不同的场景需求,生成包含情绪、方言、语种、歌声以及个性化风格的表达,实现与用户自然流畅的高质量对话,成为行业内产品级开源语音交互模型的典范。
作为中国汽车行业走向全球的领军者,吉利一直致力于成为智能汽车AI科技的引领者与普及者。早在2021年,吉利就前瞻性地围绕芯片、软件操作系统、数据和卫星网搭建起端到端的自研体系与生态联盟,构建起完善的“智能吉利科技生态网”,不断推动用户在智能驾驶、智能座舱方面的体验升级。2022年,吉利建成全球车企首个“云、数、智”一体化的星睿智算中心,为后续的技术突破筑牢根基。2023年,吉利发布全球首个汽车行业全栈自研全场景AI大模型——星睿AI大模型,凭借出色性能获得中国通信院“4+级”行业最高评级。进入2025年,吉利再次推出行业首个“智能汽车全域AI”技术体系,彰显其在智能汽车领域持续深耕的决心与实力。
借助全球最强开源的阶跃Step系列视频生成大模型、语音交互大模型,以及汽车行业全场景大模型的综合赋能,吉利在智能汽车应用层面取得重大突破。在行车安全、紧急避险、智慧泊车等全场景,用户将享受到更高等级的自动驾驶体验,安全性也大幅提升;同时,更智能的汽车情感座舱也在同步打造,重新定义人车交互模式,有力推动AI科技在智能汽车领域的广泛应用。
以吉利星睿AI大模型中的ADrive大模型为例,其具备强大的场景生成与规划能力,能够根据雨雪等不同天气光照条件、复杂道路结构、拥堵路况、立体车库以及不常见交通目标,构建出真实驾驶中极为罕见的极端驾驶场景。通过利用真实驾驶视频数据对阶跃Step-Video-T2V进行优化,可将其转化为自动驾驶数据合成器。星睿AI大模型正探索将这些丰富的合成场景转化为“以假乱真”的训练数据,就像为自动驾驶系统打造一座“虚拟驾考考场”,显著提升车辆在智能驾驶过程中应对各种复杂路况的能力,全方位保障行车安全。
得益于阶跃Step-Audio大模型超强的交互功能赋能,吉利星睿AI大模型在语音指令响应速度以及交互过程中的情感理解与表达能力上大幅提升。当用户发出“导航,快迟到了”的指令时,系统不仅能迅速规划出更快的路线,还会贴心询问是否需要播放轻音乐缓解用户的紧张情绪。此外,该系统支持粤语、四川话等多种方言识别,还提供个性化声音定制服务,用户既可以从系统预设的人声音色中挑选,也能录制孩子的笑声制作专属提示音,甚至能让车载AI模仿山涧流水声,营造出车内冥想空间,为每一次出行带来温情陪伴。
值得关注的是,吉利还是首家与DeepSeek完成深度融合的车企。通过与DeepSeek-R1模型携手,吉利将对星睿车控FunctionCall大模型、汽车主动交互端侧大模型等进行蒸馏训练。届时,吉利智能汽车AI不仅能够精准理解用户的模糊意图,准确调用约2000个车载接口,还能基于车内外场景主动分析用户潜在需求,主动为用户提供车辆控制、主动对话、售后等服务,大幅提升智能交互体验,加速AI在智能汽车领域的普及。
目前,基于“智能汽车全域AI”技术体系打造的A银河精灵、Flyme Auto智能座舱、无界空间、AI云动力、AI绘本、AI哨兵等一系列AI应用,已在银河E8、银河E5、银河星舰7EM-i等车型上搭载,为用户带来智能化的驾乘体验。今年3月初,吉利还将对外发布重磅AI智能化战略,加速推动AI数字底盘、高阶智能驾驶等最新AI技术逐步应用到更多车型上,为用户带来更具颠覆性的智能化体验。