美国华裔女院士,基于阿里云Qwen模型,成功复刻DeepSeek-R1

小阅微札记 2025-02-08 16:54:15
前言

过年期间,国产的AI智能团队上线了一个智能搜索软件Deepseek,瞬间引爆网络。

在海内外都引起了巨大的反响,成功登顶苹果市场软件下载排行榜第一。

短短几天被就成为全球下载量最多的软件之一,甚至还引起了美国特朗普的注意。

自然其创始人的身价也是水涨船高,然而让人没有想到的是,就在Deepseek爆火全球的时候,一个训练成本只有50美元的AI训练模型出现了。

而其创始人还是一位华裔美国院士,这样看来确实是有些讽刺。

那么,这究竟是怎么回事?

“横空出世”的Deepseek

在全球科技技术不大发展的时代,AI智能研究逐渐成为了各国重点的研究对象。

同时不少的人也都认为,未来将迎来AI的时代,尤其是当美国率先研究出OpenAI的时候,更是在全球引起了巨大的热度。

可以说美国的AI发展是风头正盛,而我国短时间内没有与其相较量的公司。

然而随着deepseek的上线,其强大的功能令世界惊叹,甚至比美国的OpenAI还要轰动。

其中一个原因是OpenAI从2015年成立至今,已经研究了近10年,投入的资金高达数十亿美元。

其研发过程漫长且成本高昂,主要集中在大规模模型训练和前沿技术探索上。

相比之下,DeepSeek的研发时间更短,成本也更低,但同样取得了显著的技术突破。

不仅如此,DeepSeek通过高效的研发管理和技术创新,在更短的时间内实现了高质量的模型开发,同时大幅降低了研发成本。

而DeepSeek的模型不仅在性能上表现出色,还更注重实际应用场景的优化,用户体验更加友好。

此外,DeepSeek的研发策略更加灵活,能够快速响应市场需求,这使得它在竞争激烈的AI领域中更具优势。

可以说DeepSeek以更低的成本、更短的时间和更高的效率,展现了其在AI研发领域的独特竞争力。

DeepSeek产品迅速在全球两大主要市场的应用商店中脱颖而出,成为用户争相下载的热门应用。

其影响力之大,甚至引起了科技行业巨头的关注,多家知名公司,比如亚马逊、微软等公司纷纷宣布与之展开合作。

而这一现象不仅在商业界引起轰动,还惊动了政界高层。

特朗普也对此发表了看法,认为这是本国AI产业需要警惕的信号。

然而,面对这个新兴的竞争对手,行业领军企业OpenAI的掌舵人却表现出了开放和欢迎的态度。

OpenAI首席执行官奥尔特曼

在日本首都的一次公开场合中,他称赞了这个新模型的实力,并表示欢迎良性竞争的到来。

但其也因为强大的功能和引发的超高的下载量,引发了美国的“不安”。

美国的一些州表示,将要禁止deepseek在改地区的使用,遭到了美国的封杀。

而一些美国网友则声称deepseek是现在世界上最好的人工智能,而美国的对其的封杀是非常短见的。

然而让人没有想到的是,就在我们国人为自己研发的deepseek而骄傲的时候,美国的一位院士只花费了50美元就实现了“复刻”。

其训练出来的AI模型性能直逼deepseek,而其还是一位华裔专家。

华裔院士50美元成功复刻?

在AI领域,“更大更强”似乎一直是不成文的发展法则。

而动辄数十亿美元的投入,海量的数据和算力,仿佛成了打造顶级AI模型的标配。

然而有着“AI教母”之称的华裔科学家李飞飞教授,训练的s1模型却以不到50美元的成本,彻底颠覆了这一认知。

那么,李飞飞又是何许人也,其又是如何用50美元的成本将其“创造”出来?

1976年,李飞飞出生了,而这个名字在日后的AI领域中将如雷贯耳。

16岁那年,怀揣梦想的她踏上了美国的土地,开启了一段传奇般的人生旅程。

时光飞逝,昔日的懵懂少女如今已是斯坦福大学计算机科学系的翘楚。

李飞飞教授的成就不仅仅体现在她的学术头衔上,更在于她对AI领域的深远影响。

她的研究横亘于计算机视觉与认知神经科学领域,为人工智能的发展灌注全新活力。

然而,真正令李飞飞在AI领域声名大噪的,当属其具有开创性的ImageNet项目。

这个包含上千万张标注图像的数据集,更是成为了全球AI研究者们切磋技艺的竞技场,推动了计算机视觉技术的飞速进步。

而在斯坦福大学,李飞飞不仅致力于前沿研究,还积极培养下一代AI人才。

正当人们以为已经看到了李飞飞事业的巅峰时,她却给世界带来了一个更大的惊喜。

一个成本仅50美元,却性能媲美顶级模型的AI系统横空出世。

她设计的s1模型的核心秘密在于其独特的“知识蒸馏”技术。

而这项技术犹如将海量知识浓缩成一剂精华,让AI模型能以最小的体积承载最丰富的智慧。

李飞飞团队巧妙地利用了谷歌Gemini 2.0模型和阿里云Qwen模型作为“老师”,通过精心设计的学习过程,将其精华知识传授给了“学生”s1模型,所以其训练的成本也更加的低。

通俗点讲就是基于一些大型的AI模型,训练监督微调而成的,所以其不论是成本还是难度相对都比较的低。

不过当s1模型首次亮相时,很多人对其性能持怀疑态度。

然而,事实证明这些疑虑是多余的,在AIME24数学竞赛数据集上,s1模型展现出了与DeepSeek-R1等顶级模型不相上下的表现。

这一结果不仅证明了s1模型的实力,更展示了李飞飞团队在AI优化方面的非凡造诣。

除此之外,s1模型的另一个创新点在于其“预算强制”功能。

这项功能巧妙地控制了模型的思考时间,既保证了推理质量,又大大提高了效率。

而这种平衡艺术的背后,是李飞飞团队对AI应用场景的深刻理解和巧妙设计。

其的诞生也让不少的大型AI公司产生了危机,毕竟如此低成本就可以复制出来的,性能媲美大型公司多年来研发出的AI,令人唏嘘。

对此,大家又是如何看待?

0 阅读:2
小阅微札记

小阅微札记

欢迎关注!