
人工智能领域再次迎来震撼消息,李飞飞教授的团队仅用不到50美元(约港币HK$390)成功训练出一个名为“s1”的推理模型。这个模型在数学和编程能力测试中的表现,与OpenAI的o1和DeepSeek的R1等先进推理模型相当。这一成就让美国科技界惊叹,也显示出人工智能技术的竞争越来越激烈。
李飞飞团队的s1模型,采用了来自Google的推理模型Gemini 2.0 Flash Thinking Experimental的知识,并利用“蒸馏技术”改善其AI模型。蒸馏技术是一种模型压缩方法,研究人员从一个大型、复杂的模型(称为“教师模型”)中提取知识,再指导一个较小、较简单的模型(即“学生模型”)进行学习。这样,学生模型可以保持较高性能,同时显著降低计算资源消耗。
先前DeepSeek团队曾公布其将OpenAI的训练成本压缩至原本的三十分之一,让许多人认为人工智能领域的竞争越发激烈。然后李飞飞教授的团队在短短一个月内,便用不到50美元的成本训练出了媲美DeepSeek R1的AI推理模型,这无疑再次刷新了成本与性能之间的平衡。
李飞飞团队的成功表明,蒸馏技术的应用能改善与压缩大型AI模型,还能在资源有限的环境下,保持卓越的性能。这为未来在资源受限的环境中部署和运行大型AI模型提供了有效的解决方案。
李飞飞,这位被誉为“AI教母”的华裔科学家,在人工智能领域的贡献不容忽视。她创建了全球最大的图像识别数据库——ImageNet,该数据库包含21,800个类别和超过1,400万张图像,对计算机视觉领域的发展起到了重要作用。目前,李飞飞是斯坦福大学的终身教授,也曾担任Google Cloud的首席科学家。
数据源:TechCrunch