斯坦福李飞飞团队以不到50美元训练出s1模型

三言科技 2025-02-06 16:59:54

三言科技2月6日消息,据报道,李飞飞等斯坦福大学和华盛顿大学研究人员日前以不到50美元云计算费用训练了名为s1的AI推理模型。

该模型与OpenAI的o1和DeepSeek的R1等推理模型类似。据悉,s1是通过蒸馏法由谷歌的Gemini2.0FlashThinkingExperimental提炼出的。

0 阅读:58

评论列表

有颗玻璃心

有颗玻璃心

4
2025-02-06 21:58

感觉对老美伤害不是最大,因为从长期来看,帮老美省了造一个泡沫的银子,我们并没有赢,只是阶段性战役性胜利,客观上我们帮助老美适时调整优化战略,核心损失并不大。当然也不用计较,要拥抱开源时代,直面竞争。好处是对于国内创新是一针强心剂,希望有更多政策和企业支持创新团队,能更关注创新本身,而不只是只把商业化看成是创新的前提条件。

nima不是尼玛

nima不是尼玛

3
2025-02-06 17:16

你一刀,我一刀,英伟达心在滴血

大为

大为

2
2025-02-06 19:25

50美元就训练出大模型?那又轻易打败DS了?情报可靠吗?这可不能乱说!

凯哥加坤妹=KK

凯哥加坤妹=KK

2
2025-02-06 21:04

哎,李飞飞什么时候飞回国效力

七宝

七宝

2
2025-02-06 23:00

我叫李凯凯,下载了一个ds r1模型,微调一下,花了3毛。我宣布我训练的大模型媲美r1,只花了3毛.能上新闻吗?

鸿钧噜啦啦

鸿钧噜啦啦

2
2025-02-06 17:35

用的设备就上亿美元了[捂脸哭]

简*爱

简*爱

1
2025-02-06 22:01

我们就不应该把DeepSeek开源。一开源他们也会抄袭我们了。我们搞技术霸权,他不香吗?

lovera

lovera

1
2025-02-06 19:06

这么说是要了英伟达老命了。

choAcho

choAcho

1
2025-02-06 20:40

感谢deepseek开源

理智在敲诈

理智在敲诈

1
2025-02-06 19:38

蒸馏法[doge]那也得别人先造出来

端月初三

端月初三

1
2025-02-06 22:04

星际之门永远的关上了