沉寂许久的DeepSeek又回来了！今天，DeepSeekMath-V2重磅登场

蒋东文 2025-12-02 19:29:57

沉寂许久的DeepSeek又回来了！今天，DeepSeekMath-V2重磅登场，一举夺下IMO 2025金牌，实力媲美甚至超越了谷歌的IMO金牌模型，开源AI再次扳回一局。近日，DeepSeek开源了其新一代数学模型DeepSeekMath-V2，该模型在数学推理领域实现重要突破，成为全球首个达到国际数学奥林匹克竞赛（IMO）金牌水平的开源模型。其在2025年IMO中成功解答6题中的5道，并在2024年普特南数学竞赛中取得118分（满分120）的优异成绩，表现超越人类最佳选手。此次突破的核心在于其创新的“自验证”框架。该框架设置了证明生成器、验证器和元验证器三个角色，形成自我审查闭环。生成器负责解题，验证器对推理过程进行苛刻评分，元验证器则监督验证器本身的判断质量。这种机制促使AI像数学家一样关注推导过程的严谨性，而不仅仅是答案正确与否，有效减少了“逻辑幻觉”。在权威的IMO-ProofBench基准测试中，该模型在基础集上以近99%的得分率超越谷歌同类模型10个百分点。这一成就标志着AI从追求“结果正确”迈向“过程可信”的关键一步。其技术路径为开发更可靠的人工智能系统提供了新方向，尤其在需要严格逻辑推导的科研与教育领域展现出应用潜力。#开源AI模型# #AI数学奥赛#

0 阅读：2

投资家网、正商参阅创始人，《黑天鹅时代的商业逻辑》作者

作者最新文章

1

比亚迪的实力看得见，数据只是一小部分，销量和营收也是国产自主汽车品牌独一档的存在

2

你知道“星城”吗？其实，这是长沙的“别名”。长沙地域既对应古老星宿“长沙星”

3

网友：你们觉得这俩车牌哪个更好呢？

4

同价位车子买大还是买小？如今正成为车圈难题，也戳中了俩个趋势。汽车有按尺寸分级

5

汽车是全球第一大产业，也正在成为中国第一大产业，国产主流车企这两年不管是销量还是

6

留给柴油车的时间不多了。曾驰骋公路数十载、支撑起我国物流运输半壁江山的柴油货车

7

网友：这饱满度，才是大型SUV该有的样子吧？

8

网友：据说这是某自主传统车企新设计的轿车，你们觉得怎样呢？

9

曾被认为触及天花板的PC行业，在AI浪潮下焕发新生。市场数据显示，2025年第

10

赔钱，道歉！视觉中国，终究还是在图片上栽了。近日，持续两年的摄影师戴建峰与视觉

热门分类

财经TOP

1

福布斯报道，12月16日马斯克成了史上首位身价超6000亿美元的人，截至美东时间

2

工行三年期大额存单门槛100万已经明着告诉你，不希望你们来存三年和五年定期。

3

12月8日，全天封板复盘。

4

12月16日游资龙虎榜

5

许家印实在是太聪明了，恒大暴雷后，眼看着2万亿的负债已经还不上了。而许家印造了一

6

12月26日，全天封板复盘。

7

1499的茅台没人敢买了。在茅台机场，每个人是可以买四瓶1499的茅台酒的，但

8

12月18日，全天封板复盘。

9

大A今天最坑的票诞生了，一天之内坑了5拨人，涨一波坑一拨！该票的主业是做食品饮

10

12月25日，全天封板复盘。

财经最新文章

1

从10万做到230万，我靠的不是内幕消息，也不是高深技术，而是死记硬背了5句“开

2

好消息！好消息！钱存银行的人要乐开花了，从2026年1月1日起，不管你存还是

3

#私募李蓓投资课程定价12888元#【#私募李蓓回应12888元投资课程#：不指

4

周6,4条消息，下周3天风险大不大？下周开盘会不会大涨，甚至暴涨，我直接告诉你结

5

下周一大盘会怎么走呢？下面就是我的分析：大盘昨天低开震荡走高后冲高回落，收出了一

6

美国扣我们的船不是为了油，也不是单纯制裁委内瑞拉，而是向人民币结算开火。美

7

我认识的几个在股市里真正赚到大钱的，说实话，没一个“正常人”。真的，你别不

8

2025年12月26日，作手新一，爆买4.73亿。各大股吧前十热股:淘股吧:1

9

周五复盘整理+下周重大事件前瞻！12月22日至2026年1月1日的市场热门事

10

12月26日，全天封板复盘。