伯克利团队仅30美元复制DeepSeekAI

煎蛋 2025-02-03 16:00:46

伯克利团队以30美元复制DeepSeek AI的核心功能,推出开源项目TinyZero,证明AI研究不再是高成本领域,降低了进入门槛,推动了更广泛的技术应用。

人工智能研究通常是巨头企业的专属游戏,这些公司拥有深厚的财力支持。然而,伯克利加州大学的一支研究团队却打破了这一局面。他们仅以30美元复制了DeepSeek R1-Zero的核心功能。他们的项目名为TinyZero,证明先进的人工智能推理模型并不需要耗费巨额资金。更重要的是,人工智能研究比以往任何时候都更容易接近。

在潘佳乂的带领下,该团队旨在通过强化学习(Reinforcement Learning,RL)重新构建DeepSeek的推理模型。与依赖昂贵的云服务或巨大的计算能力不同,他们使用了一个基本的语言模型、一个简单的提示和一个奖励系统来训练TinyZero。

Jiayi Pan在X平台上分享了他的兴奋之情,表示:“你可以亲身经历那一刻,只需不到30美元。”他还将TinyZero描述为第一个开源的推理模型复现项目,强调了它如何学会验证和完善自己的答案。

如何开发TinyZero

为了测试模型,研究人员选择了一个名为Countdown的游戏,玩家需要通过基本的数学运算来达到目标数字。尽管TinyZero最初是随机猜测,但随着时间的推移,它学会了验证自己的答案、寻找更好的解决方案并相应地进行调整。

他们尝试了不同规模的模型,从50亿参数到700亿参数。结果是什么?参数规模较小的模型(50亿参数)只是随机猜测答案然后停止。而参数规模较大的模型(150亿参数及以上)则学会了自我验证、完善解决方案并显著提高了准确率。

TinyZero真正引人注目的地方在于,与传统的人工智能模型相比,它的成本低得惊人。看看这些对比:

* OpenAI的API:每百万tokens收费15美元

* DeepSeek-R1:每百万tokens收费0.55美元

* TinyZero的总成本:一次性训练成本30美元

这意味着任何人(不仅仅是大型科技公司)都可以在无需烧钱到破产的情况下实验人工智能推理模型。

可用性

TinyZero是开源的,并且可以在GitHub上找到,因此任何人都可以尝试改进它。尽管它目前仅在Countdown游戏中进行了测试,但潘佳乂希望这个项目能够使强化学习研究更加普及。

当然,这仍然是一个早期阶段。“当然,其中一个缺点是,它仅在Countdown任务中得到了验证,但尚未在一般推理领域中得到验证。”Pan承认。但即便如此,其影响仍然是显而易见的:人工智能的发展并不一定要昂贵。有了像TinyZero这样的项目,低成本、开源的人工智能或许将成为未来的趋势。

本文译自 Gizmochina,由BALI编辑发布。

7 阅读:4884

评论列表

老框

老框

18
2025-02-03 18:45

我可以不花一分钱就到对面的湿地公园去遛弯:因为别人已经修好了一条直达的路……

Paradise 回复 02-03 23:17
这不是挺好么,你有什么不满意?

老框 回复 Paradise 02-03 23:35
是挺好的!但我走在路上没啥好沾沾自喜,反而可以鄙视一下边上那个拦路收费的……[吃瓜]

清心寡欲

清心寡欲

8
2025-02-03 22:18

只要大坝漫顶,大坝就会在内部被肢解。deepseek就是漫顶的水,美国科技企业就是内部肢解的各种力

煤球

煤球

8
2025-02-03 20:14

这就说…其实“我也行??”

月亮

月亮

7
2025-02-03 20:37

就是抄,deepseek可能真正使AI流行开来,这就是deepseek的可贵之外,硅谷巨头的护城河被人破了,没法割韭菜了。

金戋

金戋

6
2025-02-03 23:06

护城河破了,大巴溃于蚁穴。ai战阶段性成功了,美国被逼到了墙角 。除非埃隆马斯克短期内能成功开发火星,否则就是死路一条。

路人甲

路人甲

6
2025-02-03 22:37

开源的,你居然花了30美元,哈哈哈

够呛

够呛

5
2025-02-03 20:45

不止是国运级别,而是会推动全人类的进步,想想觉得不可思议

onion

onion

5
2025-02-03 22:46

美帝的间谍来了

Jason

Jason

4
2025-02-03 23:11

美国的科技企业所谓的AI霸权就这样完蛋了

用户10xxx72

用户10xxx72

4
2025-02-03 20:57

只要把AI打下来,美国在AI上投入的和未来的计划,就彻底泡汤了

风翎雨萧 回复 02-03 22:52
本来AI就不用花什么钱,只要你有个数据库就好了,都是从数据库里找答案

风翎雨萧

风翎雨萧

4
2025-02-03 22:50

好事情,本来就很简单,说白了,了解原理就这么简单

用户88xxx11

用户88xxx11

4
2025-02-03 23:09

如果说蒸馏是一种AI常用技术方式,那么,美国企业不会蒸馏吗?美国企业的蒸馏模型水平差吗?开源的蒸馏闭源的?有点情理不通。

阿至70 回复 02-03 23:36
怎么?接受不了霉国就是差?

用户10xxx96

用户10xxx96

4
2025-02-03 20:48

这就是科技公司破产的奥秘,它们会投资者一夜破产。

我来啦

我来啦

4
2025-02-03 21:08

英伟达是不是又要暴跌

旧时明月 回复 02-03 22:11
刚刚好,5090出来了,换显卡,舒服。[得瑟]

海边漫步

海边漫步

4
2025-02-03 22:46

照虎画猫[得瑟]

金黄的蛋卷

金黄的蛋卷

3
2025-02-03 22:06

啥子东西中国人都能干到白菜价[呲牙笑]

A蒙面大侠缺颗牙

A蒙面大侠缺颗牙

2
2025-02-03 23:11

30美元做个logo?

用户29xxx08

用户29xxx08

2
2025-02-03 23:20

扯蛋

M78星云光之国奥特之父

M78星云光之国奥特之父

2
2025-02-03 23:07

看到没,全是中国人[捂脸哭]

零部件

零部件

2
2025-02-03 22:46

美国智能化领域主要是华人🙀

风翎雨萧

风翎雨萧

1
2025-02-03 22:51

其实中国的也是复制的,基于别人的产品才发展起来的