不惧卡脖子!吉利X阶跃Step二连击,外媒:他们定义了新规则!

赛博坦利刃car 2025-02-18 17:53:28

最近,中国AI领域又甩出一张“王炸牌”——吉利与阶跃星辰联合开源的两款多模态大模型Step-Video-T2V和Step-Audio,直接让全球开发者圈炸开了锅。

尤其是Step-Video-T2V,凭借300亿参数量、204帧540P高清视频生成能力,一举超越腾讯混元成为开源视频模型“顶流”。

但更让人震撼的是,这项技术不仅能让创作者3分钟生成大片,甚至可能成为未来自动驾驶的“风向标”。

从创意到安全:视频大模型的跨界颠覆对普通用户来说,Step-Video-T2V最直观的吸引力在于“小白秒变导演”。输入一段文字描述,模型就能生成分镜流畅、物理逻辑合理的高清视频,甚至能根据“暴雨夜高速公路连环追尾”的指令,自动补全路面反光、车辆碎片飞溅等细节。

但吉利的目标远不止娱乐——通过与星睿AI大模型联动,这些虚拟场景正被转化为自动驾驶的“极端路况题库”。

吉利工程师透露,通过将Step-Video-T2V接入星睿AI大模型,可批量生成暴雨夜间高速公路连环追尾、立体车库机械故障等百万级虚拟场景。

这些经sim2real风格迁移技术处理的合成数据,正在帮助智驾系统应对0.01%概率的极端情况,使AEB紧急制动误判率下降67%。

“以AI养AI”,或将彻底解决高阶智驾的数据瓶颈。

语音交互卷出新高度:你的车比你更懂方言另一款开源的Step-Audio大模型,则重新定义了人车交互的“情商上限”。它不仅支持粤语、四川话等方言自由切换,还能通过语气识别用户情绪。

比如当你说“导航,快迟到了”,系统除了规划路线,甚至会贴心询问:“需要播放轻音乐缓解焦虑吗?”

更绝的是,用户能自由定制个性提示音,比如让AI模仿山涧流水声打造“车内冥想室”,把冷冰冰的机器变成有温度的行车伙伴。

开源背后的野心:中国AI要当规则制定者此次开源最值得玩味的是战略意图。

阶跃星辰被MIT评为中国AI“四剑客”之一,与吉利、DeepSeek在多模态生成、通用智能推理和工业级落地场景上组成技术铁三角,直接对标OpenAI、特斯拉的生态闭环。

通过将最核心的视频、语音模型开放,中国企业正在争夺多模态AI的标准话语权——就像安卓系统通过开源占领手机市场一样。

当全球开发者试图蜂拥接入中国大模型时,这种“实验室-产业端”的闭环,已让中国在AI应用层领先半个身位。

0 阅读:0
赛博坦利刃car

赛博坦利刃car

新鲜看车,看新鲜车