三言科技2月6日消息,据报道,李飞飞等斯坦福大学和华盛顿大学研究人员日前以不到50美元云计算费用训练了名为s1的AI推理模型。
该模型与OpenAI的o1和DeepSeek的R1等推理模型类似。据悉,s1是通过蒸馏法由谷歌的Gemini2.0FlashThinkingExperimental提炼出的。
三言科技2月6日消息,据报道,李飞飞等斯坦福大学和华盛顿大学研究人员日前以不到50美元云计算费用训练了名为s1的AI推理模型。
该模型与OpenAI的o1和DeepSeek的R1等推理模型类似。据悉,s1是通过蒸馏法由谷歌的Gemini2.0FlashThinkingExperimental提炼出的。
评论列表
有颗玻璃心
感觉对老美伤害不是最大,因为从长期来看,帮老美省了造一个泡沫的银子,我们并没有赢,只是阶段性战役性胜利,客观上我们帮助老美适时调整优化战略,核心损失并不大。当然也不用计较,要拥抱开源时代,直面竞争。好处是对于国内创新是一针强心剂,希望有更多政策和企业支持创新团队,能更关注创新本身,而不只是只把商业化看成是创新的前提条件。
nima不是尼玛
你一刀,我一刀,英伟达心在滴血
大为
50美元就训练出大模型?那又轻易打败DS了?情报可靠吗?这可不能乱说!
凯哥加坤妹=KK
哎,李飞飞什么时候飞回国效力
七宝
我叫李凯凯,下载了一个ds r1模型,微调一下,花了3毛。我宣布我训练的大模型媲美r1,只花了3毛.能上新闻吗?
鸿钧噜啦啦
用的设备就上亿美元了[捂脸哭]
简*爱
我们就不应该把DeepSeek开源。一开源他们也会抄袭我们了。我们搞技术霸权,他不香吗?
lovera
这么说是要了英伟达老命了。
choAcho
感谢deepseek开源
理智在敲诈
蒸馏法[doge]那也得别人先造出来
端月初三
星际之门永远的关上了