本报讯(记者袁传玺)1月16日,上海阶跃星辰智能科技有限公司(以下简称“阶跃星辰”)自研推理模型StepReasonermini上线(简称“StepR-mini”),已经在跃问网页端全量开放。目前,阶跃星辰自研的Step系列基座模型矩阵,已经覆盖了从语言、多模态到推理的全面能力。
据了解,StepReasonermini是阶跃星辰Step系列基座模型中的首个推理模型,擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。值得关注的是,这款模型既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。
在AIME和Math等数学基准测试上,StepReasonermini的成绩超过了o1-preview,比肩OpenAIo1-mini。在LiveCodeBench代码任务上,也比o1-preview效果更佳。
除了StepReasonermini以外,阶跃星辰透露也在打造视觉推理模型。这款模型针对复杂视觉场景下的Reasoning问题,引入了慢感知和空间推理的思想,把Test-TimeScaling从文本空间转移到视觉空间,实现在视觉空间下的Spatial-Slow-Thinking,预计将于今年上线。