
商汤科技在上海举办的2025技术交流日活动中,重磅推出全新升级的 “日日新SenseNova V6”大模型体系。该体系凭借多模态长思维链训练、全局记忆、强化学习等技术突破,构建起领先的多模态推理能力,同时打破成本边界,尤其值得关注的是,通过混合端云协同架构,实现了令人瞩目的超高速推理,速度高达109.5字/秒。
“日日新 V6” 系列大模型在性能上实现了质的飞跃。原生多模态通用大模型SenseNova V6 Pro采用6200亿参数的混合专家(MoE)架构,而SenseNova V6 Reasoner Pro在其基础上,历经多模态长思维链训练和多模态增强学习,多模态融合推理能力极为突出。在纯文本和多模态推理任务方面,该模型可对标OpenAI的o1模型以及谷歌Gemini 2.0 Flash – thinking。
在实际应用场景中,“日日新 V6”的强大推理能力得以充分展现。例如在保险理赔场景下,它能够依据打印检查单、手写处方等商业医疗保险理赔材料,精准检查是否存在乱开药、乱检查、材料缺失或对不齐等问题。在具身智能领域,装载了商汤大模型的傅利叶通用人形机器人 GRx,不仅能够准确辨别矿泉水和可乐,还能根据用户 “想减肥” 的需求给出合理建议。
值得一提的是,“日日新 V6”系列还涵盖视频理解模型SenseNova V6 Video和轻量级的全模态交互模型 SenseNova V6 Omni。其中,V6 Video支持长达10分钟的视频完整输入,能够对视频进行深入理解、分析与推理,打破了传统模型仅支持短视频的限制。凭借 “全局记忆” 能力,它可实现10分钟级视频全帧率解析,并能对视频精彩内容进行智能剪辑输出。V6 Omni 则支持实时交互,同时保持优秀的综合性能,对标OpenAI GPT 4o – mini,在角色扮演、翻译点读、文旅导游、讲解绘本、数学讲解等场景下均经过深度优化,拥有更贴近人类的感知、表达以及情感理解能力,目前已在具身智能等领域实现多行业、多场景落地。