DeepSeek-R1发布，性能对标OpenAIo1正式版

Magicflu小小汪 2025-01-24 12:49:55

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版。

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

知名AI评测员Matthew Berman表示，R1拥有他所见过的最像人类的内心独白。

从“人类教”到“自己学”

DeepSeek-R1的这种特点，和它独特的训练方式有关。

传统的AI训练有三个阶段：预训练、SFT（监督微调）、RL（强化学习）。打个比方，传统AI需经历三阶段学习：先在预训练阶段里“背书自学”基础知识，再在SFT阶段里“抄写教案”模仿人类示范，最后在RL阶段里“模拟考试”优化表现。

而R1 Zero跳过了SFT阶段，直接进入了RL阶段。也就是说，DeepSeek-R1直接砍掉用人工标准数据训练的“模仿”环节，而是仅凭基础语言能力和数学规则，在持续解题试错中自悟知识体系。

SFT的使用是当年ChatGPT成功的关键，而R1 Zero完全用强化学习替代了SFT。

DeepSeek-R1成功的秘诀在于构建了一个智能训练场，这一系统由三个技术组件构成：动态题目生成系统、过程验证体系和协同工作机制。用一个比喻来说，每解完一题，系统自动生成更难的变体题，并实时验证解题过程逻辑是否自洽。它迫使AI像数学家般提炼方法论，甚至能将几何证明中的反证法迁移到代码检测中。

这个训练过程展示了强化学习的潜力。未来的AI发展，依然充满无限可能。

强大，便宜，还开源

据介绍，DeepSeek-R1的功能比肩OpenAI o1。

根据DeepSeek官方公布的数据，DeepSeek-R1在AIME2024上获得了79.8%的成绩，略高于OpenAI-o1-1217的79.2%。在MATH-500上，它获得了97.3%的惊人成绩，表现略高于OpenAI-o1-1217的96.4%，并明显优于其他模型。在编码相关的任务中，DeepSeek-R1在Codeforces上获得了2029 Elo评级，在竞赛中表现优于96.3%的人类参与者。对于工程相关的任务，DeepSeek-R1的表现略优于OpenAI-o1-1217。

0 阅读：7

Magicflu小小汪

强大的无代码零代码数字中台魔方网表的学习资料汇总

作者最新文章

1

我认为AI生成代码并不会替代无代码开发平台，最终应该是无代码开发平台把AI能力吸收进来。

2

征求各行业行业数字化合作伙伴，进行行业应用共创。

3

魔方网表AI知识库秒灵开始内测

4

魔方网表在CRO行业可以说已经取得了令人瞩目的成绩

5

AI如何影响企业应用呢？我认为目前比较靠谱的两个方向一个是AI知识库一个是AIAgent。

6

太多无代码开发平台和零代码开发平台都不是真的无代码

7

有人问我为什么魔方网表有一段时间没出新的版本了，在做什么？

8

宽松的财政和货币政策加持下，相信明年的经济一定会好起来，要有信心！

9

魔方网表现在不限账号

10

一个企业自身的AI训练数据应该是企业核心资产

科技TOP

1

手机国补1月20日上线,叠加商家优惠补上加补,华为受益大于苹果

2

三星没有料到,高通正式表态外媒:3nm芯片开始说再见了

3

中端市场的“卷王”,骁龙8Gen3+2K屏+6550mAh,如今售价一跌再跌

4

宣布:谁敢进入乌克兰,就击沉!你击沉试试?

5

1999元!小米明年第一款手机,实力太强了吧

6

手机信号最强品牌揭晓,这三款机型覆盖范围最广,信号稳定不掉线

7

荣耀不要利润了?5800mAh+1亿像素+256GB,如今低至1104元起

8

华为又立功了,荣耀手机挡住了子弹

9

两万件专利一夜归零?任正非也没料到,外媒:美把事情闹大了

10

1869元,刚官宣这直屏手机,绝对是来捣乱的

科技最新文章

1

百元机也很良心!1亿像素+12GB+256GB+120Hz,跌至857元

2

华为打响“价格战”,12GB+512GB再降1851元,高端旗舰加速退场

3

万年8GB内存时代终结!三星GalaxyS25系列全系标配12GB

4

万元安卓机皇!三星GalaxyS25Ultra图赏

5

微信春节前更新,界面进行大改版!

6

华为新旗舰即将发布,配置超猛,Mate70瞬间不香了

7

12GB+512GB现史低价!麒麟9000S+5000万像素,成年底捡漏王!

8

MagicOS9.0正式版发力:多款数字系列机型率先体验,你的在内吗

9

三星果断清仓了,跌价3370元,触控笔+四长焦+100倍变焦+2K屏幕

10

十六年前的“洋垃圾”手机,摄像机造型+HDMI口,吸引3万人围观

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量