斯坦福李飞飞团队训练出媲美DeepSeek的推理模型，费用不到50美元

孤岚和科技 2025-02-08 10:57:04

2月6日，斯坦福大学李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

研究人员表示，s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的，使用16个英伟达H100 GPU进行了26分钟的训练。

注：「不到50美元」仅为云计算服务费用，不包括服务器、显卡等硬件投入费用，因这部分已经由云厂商承担。

简单高效的训练方法，挑战传统AI研发模式

s1的研究团队表示，s1模型是以谷歌推理模型Gemini2.0 Flash Thinking Experimental为基础模型，通过蒸馏法提炼出来的。

他们采用了一种名为test-time scaling的方法。研究团队构建了一个小型数据集s1K，通过难度、多样性和质量三个标准来筛选，其中包括1000个经过精心挑选的问题以及相应答案，并附上了「推理」过程，仅使用了16台英伟达H100 GPU，耗时26分钟就完成了训练。

这种方法与传统的大规模强化学习方法（RL）形成鲜明对比，后者的成本通常较高，DeepSeek、OpenAI都采用了这种方法。而s1的研究通过较小的数据集和监督微调（SFT）蒸馏推理模型，大大降低了训练成本并提高了效率。

此外，为了提高答案的准确度，研究团队还运用了一种「预算强制」技术，可以控制测试时间计算，通过强制提前终止模型的思考过程，或在s1推理时多次追加「等待」指令以延长思考，从而优化性能。

--TOP大学来了

0 阅读：19

孤岚和科技

感谢大家的关注

作者最新文章

1

不列颠哥伦比亚大学Nature:转角石墨烯中莫尔驱动的拓扑电子晶体

2

Nat.Commun.|3R-MoS₂在范德华堆叠结构下的非线性...

3

清华AI光学计算：光谱卷积神经网络芯片，数据吞吐量降低了96%

4

Sci.Adv.|纳米光子赋能光电子芯片无损检测

5

Nat.Mater.可打印分子选择性核壳纳米颗粒，可穿戴与植入式传感器

6

斯坦福李飞飞团队训练出媲美DeepSeek的推理模型，费用不到50美元

7

Nat.Nano.|二维滑移铁电：多界面极化翻转路径机理研究

8

上海交大Nature！提出新的材料合成策略

9

华中科技大学AM综述|二维分子晶体在电子与光电子器件中的应用

10

英伟达憾失DeepSeek关键人才？美国放走AI「钱学森」

科技TOP

1

中方警告无效,DeepSeek被封禁,出手的不是美国,马斯克拒绝收购

2

又一黑马诞生!年入6126亿远超腾讯小米,这个浙江人藏得太深了

3

华为新机正式公布!4月发布,网友:手里的华为mate70突然不香了

4

天玑9300+处理器+6400mAh大电池,它是2000以内性能最强的手机!

5

仅2634元!骁龙8至尊版+6500mAh,新机已开售

6

年后换机别乱买,这三款骁龙8Gen3手机最值得入手,已降至冰点价

7

罗福莉:一个95后天才少女如何从小镇女孩到AI女王

8

6.3英寸+7000mAh,我心动了

9

vivo“续航王”售价创新低,6500mAh+80W,堪称同价位“新卷王”

10

荣耀Magic8曝光:新形态影像+24GB运存,满分答卷

科技最新文章

1

iOS18.4重磅升级实测:Pro用户笑了,标准版哭了!这些机型血赚

2

“国补”买手机的又被“背刺”了,现在还有合约补、话费补,等等党赢麻了

3

华为发布14款新品,价格从249元到36999元,你最爱哪款?

4

荣耀中端新机曝光:骁龙7Gen4+7800mAh电池,续航大幅提升

5

曝华为nova14搭载麒麟9000A,即将开始备货,你期待吗?

6

美国施压,高通不会为华为Mate70定制4G版的骁龙8Elite

7

vivoS21Pro亮相:满分四摄+6050mAh,真的会谢

8

DeepSeek预测:未来十年不仅工资高,而且很难失业的12个职业!

9

刘强东拿下小米汽车大单

10

华为刚刚宣布:3月3日,新机再次开售!

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量