商汤科技发布“日日新6.0”大模型，以“强推理”与超高速推理引领行业变革

商汤科技在上海举办的2025技术交流日活动中，重磅推出全新升级的 “日日新SenseNova V6”大模型体系。该体系凭借多模态长思维链训练、全局记忆、强化学习等技术突破，构建起领先的多模态推理能力，同时打破成本边界，尤其值得关注的是，通过混合端云协同架构，实现了令人瞩目的超高速推理，速度高达109.5字/秒。

“日日新 V6” 系列大模型在性能上实现了质的飞跃。原生多模态通用大模型SenseNova V6 Pro采用6200亿参数的混合专家（MoE）架构，而SenseNova V6 Reasoner Pro在其基础上，历经多模态长思维链训练和多模态增强学习，多模态融合推理能力极为突出。在纯文本和多模态推理任务方面，该模型可对标OpenAI的o1模型以及谷歌Gemini 2.0 Flash – thinking。

在实际应用场景中，“日日新 V6”的强大推理能力得以充分展现。例如在保险理赔场景下，它能够依据打印检查单、手写处方等商业医疗保险理赔材料，精准检查是否存在乱开药、乱检查、材料缺失或对不齐等问题。在具身智能领域，装载了商汤大模型的傅利叶通用人形机器人 GRx，不仅能够准确辨别矿泉水和可乐，还能根据用户 “想减肥” 的需求给出合理建议。

值得一提的是，“日日新 V6”系列还涵盖视频理解模型SenseNova V6 Video和轻量级的全模态交互模型 SenseNova V6 Omni。其中，V6 Video支持长达10分钟的视频完整输入，能够对视频进行深入理解、分析与推理，打破了传统模型仅支持短视频的限制。凭借 “全局记忆” 能力，它可实现10分钟级视频全帧率解析，并能对视频精彩内容进行智能剪辑输出。V6 Omni 则支持实时交互，同时保持优秀的综合性能，对标OpenAI GPT 4o – mini，在角色扮演、翻译点读、文旅导游、讲解绘本、数学讲解等场景下均经过深度优化，拥有更贴近人类的感知、表达以及情感理解能力，目前已在具身智能等领域实现多行业、多场景落地。

0 阅读：0