卷飞了，斯坦福李飞飞团队用50美元，训练出媲美DeepSeekR1的模型

正直云朵 2025-02-07 18:24:16

AI大模型由于“蒸馏”技术的出现，呈现突飞猛进的大飞跃；其模型训练成本越来越低，已经出现“零元训”趋势，未来“赚钱训”都可能！

Deepseek_R1爆出来的训练成本是577万美金，但是其生不逢时，才火了不到一个月，就遇到了强劲的挑战对手。

来自斯坦福大学和华盛顿大学的李飞飞团队做出的S1大型，推理模型云计算训练成本不到50美元，然而其性能可以媲美Deepseek_R1。

李飞飞团队的S1大模型是由谷歌的Gemini 2.0蒸馏所得，仅使用16块英伟达H100 GPU；训练了26分钟便获得了如此高的性能，惊呆了所有人！

50美元合计人民币350元左右，这个在科研中算成本吗？估计连电费都不一定够。不过Deepseek的577万美元，也是其训练费用，也没有算其它的成本在里面！

英伟达H100GPU芯片一个都要1万美元以上，而S1用了16块，显然所有模型都不算这块成本，只算了训练时候的消耗，就是“电费成本”等等；人工都没有算。大家要注意这是“训练消耗”，不是完全成本！这也是“蒸馏”技术的一部分！

从这方面说，Deepseek的577万美元训练，在当下成本明显偏高了。不过Deepseek_R1出来比S1早，可能在当时技术上难度训练难度更高，花钱更多也是可能的！

DeepSeekR1模型的出现，给AI界带来了一系列的连锁反应；让AI的进化速度越来越快了；全世界的大模型都在积极发展。

这些技术的出现，让OpenAI现在非常艰难，其在2月5日已经被迫宣布免费开放ChatGPT搜索，无需注册即可使用。

从Deepseek_R1与S1等AI大模型的进化速度看，人工智能的能力，在未来将会越来越离谱了；在各做在大模型这块会卷飞的，会一个比一个训练成本低，最后可能会赚钱训练的。

以现在人工智能技术进步的速度与创新成本的大幅下降，一些服务性工作将会慢慢消失，大模型的解决能力比人不知道要强多少倍；很多工作会被AI慢慢替代的。

AI模型其一秒钟的学习能力，很多人一辈子都学不到！这样下去，大家读书的价值在哪里呢？从这方面说，卷读书已经意义不大，等你的孩子长大了，发现会无工作可干了！能干都是的都是一些传统的技术活！

1 阅读：279