AI大模型由于“蒸馏”技术的出现,呈现突飞猛进的大飞跃;其模型训练成本越来越低,已经出现“零元训”趋势,未来“赚钱训”都可能!
Deepseek_R1爆出来的训练成本是577万美金,但是其生不逢时,才火了不到一个月,就遇到了强劲的挑战对手。
来自斯坦福大学和华盛顿大学的李飞飞团队做出的S1大型,推理模型云计算训练成本不到50美元,然而其性能可以媲美Deepseek_R1。
李飞飞团队的S1大模型是由谷歌的Gemini 2.0蒸馏所得,仅使用16块英伟达H100 GPU;训练了26分钟便获得了如此高的性能,惊呆了所有人!
50美元合计人民币350元左右,这个在科研中算成本吗?估计连电费都不一定够。不过Deepseek的577万美元,也是其训练费用,也没有算其它的成本在里面!
英伟达H100GPU芯片一个都要1万美元以上,而S1用了16块,显然所有模型都不算这块成本,只算了训练时候的消耗,就是“电费成本”等等;人工都没有算。大家要注意这是“训练消耗”,不是完全成本!这也是“蒸馏”技术的一部分!
从这方面说,Deepseek的577万美元训练,在当下成本明显偏高了。不过Deepseek_R1出来比S1早,可能在当时技术上难度训练难度更高,花钱更多也是可能的!
DeepSeekR1模型的出现,给AI界带来了一系列的连锁反应;让AI的进化速度越来越快了;全世界的大模型都在积极发展。
这些技术的出现,让OpenAI现在非常艰难,其在2月5日已经被迫宣布免费开放ChatGPT搜索,无需注册即可使用。
从Deepseek_R1与S1等AI大模型的进化速度看,人工智能的能力,在未来将会越来越离谱了;在各做在大模型这块会卷飞的,会一个比一个训练成本低,最后可能会赚钱训练的。
以现在人工智能技术进步的速度与创新成本的大幅下降,一些服务性工作将会慢慢消失,大模型的解决能力比人不知道要强多少倍;很多工作会被AI慢慢替代的。
AI模型其一秒钟的学习能力,很多人一辈子都学不到!这样下去,大家读书的价值在哪里呢?从这方面说,卷读书已经意义不大,等你的孩子长大了,发现会无工作可干了!能干都是的都是一些传统的技术活!
天空的翅膀
大数据蒸馏技术,和盗贼有什么区别!
雪碧
有AI教母之称身兼数职的李飞飞,五十美元够她一分钟的收入不?这是打脸的,看不懂就别说话。
Mobile0086
人类智能的进阶之路可能在修仙!