AI教母50美元成功训练AI模型挑战DeepSeek蒸馏他人模型根本不花钱

逢纪说科技 2025-02-09 22:38:33

人工智能领域再次迎来震撼消息，李飞飞教授的团队仅用不到50美元（约港币HK$390）成功训练出一个名为“s1”的推理模型。这个模型在数学和编程能力测试中的表现，与OpenAI的o1和DeepSeek的R1等先进推理模型相当。这一成就让美国科技界惊叹，也显示出人工智能技术的竞争越来越激烈。

李飞飞团队的s1模型，采用了来自Google的推理模型Gemini 2.0 Flash Thinking Experimental的知识，并利用“蒸馏技术”改善其AI模型。蒸馏技术是一种模型压缩方法，研究人员从一个大型、复杂的模型（称为“教师模型”）中提取知识，再指导一个较小、较简单的模型（即“学生模型”）进行学习。这样，学生模型可以保持较高性能，同时显著降低计算资源消耗。

先前DeepSeek团队曾公布其将OpenAI的训练成本压缩至原本的三十分之一，让许多人认为人工智能领域的竞争越发激烈。然后李飞飞教授的团队在短短一个月内，便用不到50美元的成本训练出了媲美DeepSeek R1的AI推理模型，这无疑再次刷新了成本与性能之间的平衡。

李飞飞团队的成功表明，蒸馏技术的应用能改善与压缩大型AI模型，还能在资源有限的环境下，保持卓越的性能。这为未来在资源受限的环境中部署和运行大型AI模型提供了有效的解决方案。

李飞飞，这位被誉为“AI教母”的华裔科学家，在人工智能领域的贡献不容忽视。她创建了全球最大的图像识别数据库——ImageNet，该数据库包含21,800个类别和超过1,400万张图像，对计算机视觉领域的发展起到了重要作用。目前，李飞飞是斯坦福大学的终身教授，也曾担任Google Cloud的首席科学家。

数据源：TechCrunch

0 阅读：56

逢纪说科技

感谢大家的关注

作者最新文章

1

MistralAI推出聊天机器人LeChat手机版App，1秒可输...

2

野火过后：逃离火海的动物难民，如何在焦土求生？

3

AI教母50美元成功训练AI模型挑战DeepSeek蒸馏他人模型根本不花钱

4

诺奖得主：DeepSeek目前只算是“玩具”但它戳破硅谷AI投资盲点

5

传软银将投资400亿美元！有望推升OpenAI估值达3,000亿美元

6

法国、阿联酋计划斥资500亿欧元，在法国打造AI数据中心

7

希腊圣托里尼岛10天超过7千次地震，进入紧急状态万人撤离

8

300任务启动！非洲电力革命：投入350亿美元，六年内让3亿人通电

9

三星2纳米制程测试良率高于预期，力供Exynos2600准时量产推出

10

英特尔2024年服务器处理器交13年来最差成绩，新产品仍难保持优势

科技TOP

1

重磅铁拳,中科院正式宣布,中方开始关闭EUV的大门

2

刚刚入网的荣耀GTPro,配置有点猛啊

3

1TB!去年捅破天的Ultra,杀回来了

4

下个月起,微信支付宝或将迎来“调整”!出门又要带“现金”了?

5

错位:黄仁勋李在容为中国市场奔走郭台铭李嘉诚为去中国化而出走

6

美团正式发布独立品牌“美团闪购”订单平均30分钟送达

7

可外接独立镜头,vivoX200Ultra配置全曝光,能打电话的相机?

8

"104%关税触发末日按钮?中国启动'彩虹防御',马斯克连夜改航班"

9

7600mAh只卖1千多,vivo超大电池的游戏手机来了

10

8000mAh+卫星通信+三防机身,这新机有点猛

科技最新文章

1

2899元起!一加13T正式发布:小直屏+6260mAh+骁龙8至尊版

2

国补后2899元起,小屏手机一加13T发布,搭载骁龙8至尊版处理器

3

小米YU9曝光,雷军让3亿中产沸腾了

4

vivoX300Pro亮相:97.5%屏占比+24GB运存,独领风骚

5

首款骁龙8至尊千元机!2K直屏+7000mAh,iQOO半迭代S旗舰即将登场

6

中端“刺客”!荣耀X60GT直接开售!

7

24G+1T才2819元,还有100W超级快充+骁龙8Gen2旗舰

8

三星GalaxyS24轻薄美学,与实用主义的完美融合

9

OPPO新机官宣:4月22日,全新登场

10

续航强劲,流畅持久,游戏玩家的理想之选

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量