沉寂许久的DeepSeek又回来了!今天,DeepSeekMath-V2重磅登场,一举夺下IMO 2025金牌,实力媲美甚至超越了谷歌的IMO金牌模型,开源AI再次扳回一局。 近日,DeepSeek开源了其新一代数学模型DeepSeekMath-V2,该模型在数学推理领域实现重要突破,成为全球首个达到国际数学奥林匹克竞赛(IMO)金牌水平的开源模型。其在2025年IMO中成功解答6题中的5道,并在2024年普特南数学竞赛中取得118分(满分120)的优异成绩,表现超越人类最佳选手。 此次突破的核心在于其创新的“自验证”框架。该框架设置了证明生成器、验证器和元验证器三个角色,形成自我审查闭环。生成器负责解题,验证器对推理过程进行苛刻评分,元验证器则监督验证器本身的判断质量。这种机制促使AI像数学家一样关注推导过程的严谨性,而不仅仅是答案正确与否,有效减少了“逻辑幻觉”。 在权威的IMO-ProofBench基准测试中,该模型在基础集上以近99%的得分率超越谷歌同类模型10个百分点。这一成就标志着AI从追求“结果正确”迈向“过程可信”的关键一步。其技术路径为开发更可靠的人工智能系统提供了新方向,尤其在需要严格逻辑推导的科研与教育领域展现出应用潜力。#开源AI模型# #AI数学奥赛#
