2月18日,国内大模型“六小虎”之一的阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型开源。
开源模型包括视频生成模型Step-Video-T2V,参数量300亿,可直接生成204帧、540P分辨率的高质量视频;语音交互大模型Step-Audio,能根据不同场景生成情绪、方言、语种、歌声和个性化风格,和用户自然地高质量对话。
阶跃星辰与吉利汽车集团在算力算法、场景训练等领域深度合作。吉利汽车集团CEO淦家阅透露,吉利全栈自研的星睿AI大模型已与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合。
多模态模型一直是阶跃星辰重点方向,公司创始人、CEO姜大昕表示,多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,AGI的实现离不开开发者共同努力,希望能为开源社区贡献力量,共同拓展模型技术边界,推动产业落地。(澎湃新闻记者秦盛)