成本不到50!美国华裔女院士成功复刻Deepseek,性能媲美顶级模型

来科点谱 2025-02-10 13:58:47

文| 来科点谱

编辑| 来科点谱

——【·前言·】——

在今年 1 月 27 号的时候,中国自主研发的 AI 应用 DeepSeek 太牛了,在美国手机应用商店里直接冲到榜首,安装量比当时的 AI 界大佬 ChatGPT 还高。

这一事件不仅让DeepSeek的创始人梁文锋声名鹊起,更象征着中国AI力量在国际舞台上的强势崛起,一时之间,“来自东方的神秘力量”的称号不胫而走,全球为之瞩目。

就在 DeepSeek 备受全球瞩目的时候,斯坦福大学神不知鬼不觉地拿出了 S1 这个 AI 模型,成本才 50 美元,可性能却和行业顶尖模型不相上下。

这不禁让人好奇,S1 到底只是短暂地出出风头,还是会开启 AI 发展的全新方向?它会怎么影响 DeepSeek,又会给整个人工智能行业带来啥样的变化呢?

DeepSeek:中国AI黑马

DeepSeek 能火不是天上掉馅饼,而是中国人工智能厚积薄发的产物,2023 年 7 月,来自广东湛江的梁文锋创建了这款应用。

当时美国 AI 发展势头正盛,到处都在说这个事儿,可谁能想到,DeepSeek 毫无征兆地冒出来,在海外市场瞬间爆火,好多国家的人都对它爱不释手。

根据统计,24 年 1 月 25 日时,DeepSeek 在老美安装量超 160 万次,稳坐榜首,用户数量的增长速度快得让人咋舌,真可谓一骑绝尘 。

DeepSeek 能火起来,既得益于它精准把握市场机遇,也离不开技术上的创新,比如 DeepSeek-V3 版本,采用很多巧妙的优化手段,大幅降低了训练成本。

比如说,它很会 “精打细算”,只让模型里真正有用的部分工作,在保证结果不受影响的前提下,把计算精度降低,在控制成本上堪称一绝。

为了让训练效果更好,DeepSeek 下了不少功夫,它筛选数据去掉多余的,留下精华,再结合知识蒸馏技术,成功提升了训练效率,既增强了性能,又提高了效率,一举两得。

DeepSeek 发展势头这么猛,行业里的大公司都坐不住了,Meta 直接把它当成新对手,开始仔细研究它的技术和运营方法,想看看它到底有啥过人之处。

这就表明 DeepSeek 的影响力已经不只是一个普通应用那么简单了,它开始对整个 AI 产业的格局产生影响。

S1登场

DeepSeek 在全球把人工智能应用的热度炒翻天的时候,美国学术圈突然蹦出个极具竞争力的对手。

几家顶尖机构联合发力,推出名为 S1 的 AI 推理模型,值得关注的是,它在训练时借助云计算,成本控制在 50 美元以内,这在 AI 领域中十分罕见,有望改变行业格局。

此次研究由斯坦福大学计算机科学系的李飞飞教授挂帅,在 AI 行业,李飞飞教授堪称传奇人物,地位举足轻重,是大家公认的大拿,有她引领,研究成果十分值得期待。

S1 的性能堪称惊艳,在多个测试数据集中,它的表现与 DeepSeek 的 R1 模型、谷歌 Gemini 2.0 Thinking API 等行业头部模型几乎无异,展现出了强大的实力,潜力无限。

以前训练 AI 模型,用的是大规模强化学习方法,这得耗费超多的算力,数据量需求也大,成本相当高,但 S1 不走寻常路,它采用了 “蒸馏” 技术。

这个技术能从超大型的 AI 模型里,把最关键、最精华的部分提取出来,再压缩成一个小巧但能力超强的模型型,训练成本和时间都大大减少。

为了让 S1 更实用,他们特意弄出个 “预算强制” 功能,它能限定模型测试时想问题的时间,逼着模型在规定时间内把任务完成,就像考试必须在规定时间交卷一样。

这功能可不只是单纯设定个时间,它要么强制模型早点结束思考,要么下达 “等待” 指令,用这种灵活的方式控制模型推理时间,从而让效率和性能达到平衡。

S1 的成功可不只是因为它性能好、成本低,更重要的是它展示出了一种全新的 AI 模型开发方式,以前开发 AI 模型就是一场 “烧钱” 比赛,谁的计算资源多、数据多,谁就更有可能成功。

但是S1的出现打破了这种老观念,证明了就算资源有限,只要方法对,还是能训练出高性能的 AI模型,这种用很少的资源办大事的策略,不仅能省钱,还能激发更多的创新,给AI领域注入新的活力。

当然S1 现在还处于早期阶段,在处理更复杂认知任务的时候表现怎么样,还得再看看,“蒸馏” 技术在提升全新 AI 模型性能方面,长期效果到底如何,也需要持续观察。

S1 的出现可不是为了把 DeepSeek 这些模型比下去,它是一种全新的尝试,就像在美食界,别人做的是经典菜肴,S1 却开始研究新的烹饪方式,给 AI 领域带来了新的灵感和方向。

AI领军人物李飞飞

斯坦福 S1 的创造者李飞飞,可不是一般的大学教授,她在 AI 领域那可是超级重要的领军人物,李飞飞 1976 年出生在北京,她的求学经历就像一部励志传奇。

16 岁的时候,她跟着父母移民到美国,要知道到一个新国家,得克服语言和文化上的大难题,但她特别努力,最后成功考上了普林斯顿大学,后来又在加州理工学院拿到了博士学位。

李飞飞打造的 ImageNet 数据库,对 AI 产业,尤其是计算机的发展来说,那作用大得没话说,它就像给 AI 产业发展铺了块稳稳当当的大石头。

她还培养出好多 AI 领域的顶尖人才,像英伟达人工智能负责人范吉姆,还有 GPT - 4 项目里特别重要的安德鲁?卡帕西,这些都能看出她在 AI 领域有多厉害。

对于 S1 取得的成功,李飞飞有着更深层次的理解,她觉得 S1 可不是为了和 DeepSeek 这些商业 AI 应用直接对着干。

团队的目标是摸索出一种新的 AI 开发模式,让 AI 技术不再高不可攀,更多人都能参与到 AI 的研发和应用中,S1 成本低、性能又出色,完美证明了这个理念。

其实 S1 的诞生有迹可循,它借鉴了众多开源模型,还在 Qwen 的基础上做了优化,这正体现出 AI 领域大家相互合作、共同进步的理念。

S1 通过精心挑选一千条高质量的素材来训练,在资源有限的情况下,最大程度地发挥出了性能,这给 AI 模型的开发提供了新的思考方向。

这场竞争不仅仅是技术上的较量,更是人才、资金和战略的全面比拼,而AI的快速发展也带来了前所未有的挑战,其中伦理和社会问题尤为突出。

AI 技术是把双刃剑,在飞速发展的同时,也带来了安全性、公平性和可控性的挑战,更让人担忧的是,它可能引发失业潮,加剧社会不平等,这些棘手的问题,是人类必须直面和攻克的难关。

参考资料

成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了---2025-02-06 ---华尔街见闻

35 阅读:31181

评论列表

演绎漫长人生

演绎漫长人生

101
2025-02-10 22:28

50美金 这脑子不是残疾,就是全部残疾

吴一是 回复 02-11 21:35
50是残废补助金?!

尊崇正义

尊崇正义

65
2025-02-11 00:35

制造谣言烂自媒体还是时不时都存在

用户10xxx68

用户10xxx68

54
2025-02-10 21:21

又一个华人为美国人服务,可叹

峰峻 回复 02-12 07:16
叹个鸡毛啊,华人就是外国人

群众 回复 02-12 09:29
16岁出去的算啥二代,出生在外国才是二代。

用户10xxx63

用户10xxx63

54
2025-02-11 00:32

为啥不是50美分呢?USdeepseek,还可以勉强接受,至少US强盗,敢做敢当。

木烟逸燃 回复 02-11 11:44
算力外包而已,说白了就是租用英伟达服务器就可以了

不戒

不戒

54
2025-02-11 08:34

有事儿说事,别扯华裔的蛋套近乎,这些年美国最反华的势力里面就有不少华裔冲锋陷阵,跳的那叫一个欢!

|.穱ゞ.°ゞ 回复 02-12 09:45
梁文锋向谁敬酒了吗?说来听听!

人性丑陋 回复 |.穱ゞ.°ゞ 02-12 11:45
你问了个幼稚的问题

pc2boy

pc2boy

50
2025-02-11 09:10

蒸馏的前提是数据已经被处理过,对于最新的数据,肯定不会从蒸馏当中得到答案。 Deep seek只是应用了蒸馏,而不是这一种纯粹依靠蒸馏的大模型。所以两者之间没有可比性。

ll 回复 02-11 18:02
对的,ds与李飞飞没可比性,李飞飞的模型是对谷歌模型的结果简化引用,类似快手推出个快手极速版,然后吹快手出创新了,这有什么资格与deepseek比类呢

辛壬癸甲

辛壬癸甲

36
2025-02-10 23:39

应吃点💊

冥天

冥天

34
2025-02-10 23:49

邯郸学步、东施效颦,可笑至极

laef

laef

33
2025-02-11 09:50

这个是润人,跑到霉国坑害全世界的[得瑟]

我就是他的那个朋友

我就是他的那个朋友

28
2025-02-11 07:34

只要不是被老美用来进行资本垄断的开源AI都欢迎,开源才会知识迭代,封闭只会墨守成规。科学不需要墨守成规

冬不拉

冬不拉

27
2025-02-11 07:15

没DS,她搞个屁啊,来蹭DS热度[笑着哭]

用户10xxx76

用户10xxx76

27
2025-02-10 23:10

不为国所用,有什么用?

laef 回复 02-11 09:51
应该弄死它呗[得瑟]

218892

218892

24
2025-02-11 10:26

注意是蒸馏!就像白酒一样,得有原液喔。

青青子衿

青青子衿

24
2025-02-11 08:59

数据蒸馏而已,有啥大惊小怪的,跟deepseek没法比[滑稽笑]

用户10xxx84

用户10xxx84

23
2025-02-11 12:05

没有别的软件大模型的支撑,她啥也干不出来

用户10xxx67

用户10xxx67

21
2025-02-11 02:47

问一下DEEPSEEK就行了,明显不行的

海风

海风

16
2025-02-11 13:43

这篇文章是用50美元的AI写的吧,智商很感人。

人马座卯兔

人马座卯兔

16
2025-02-10 21:04

这不重要,重要的是,在美国身上再插一次刀

处处观察

处处观察

13
2025-02-11 05:32

DeepSeek提供各种版本大小的模型库,本地部署都不用花一分钱,只要硬盘足够大,就能搞出性能相同的大模型

诗和远方

诗和远方

13
2025-02-11 06:00

不是免费下载吗?这个傻女花了50美金下载的。。。

用户11xxx10

用户11xxx10

12
2025-02-11 13:30

尖嘴猴腮!一看就不是什么好鸟!

ps720980

ps720980

11
2025-02-11 13:35

什么华裔,自欺欺人,就是外国人好吧

吐槽说实话

吐槽说实话

9
2025-02-11 16:59

我发现美国但凡一个垄断被打破,就立马出很多小作文

昵称总被占用

昵称总被占用

9
2025-02-11 08:02

管他真假,反正又给美国的AI霸权上插了一刀

舔既合发-喷既爪 回复 02-11 10:14
这是真的,其他都是有色眼镜。谁好谁坏鬼知道。

风飘叶落

风飘叶落

8
2025-02-11 14:08

科技走到最后不过是中国人之间的对决罢了

木烟逸燃

木烟逸燃

8
2025-02-11 11:43

她的模型很简单,把最重要的算力外包了[笑着哭]。

约定的梦幻岛

约定的梦幻岛

8
2025-02-11 11:56

读书人的事,不叫剽窃,叫蒸馏,那我直接改个名字岂不是0成本?

欣之辰

欣之辰

7
2025-02-11 12:03

何必花这“五十美元巨款”?本来就是开源免费使用的了。

用户10xxx75

用户10xxx75

7
2025-02-11 10:40

她用的谷歌的云,只是服务费50元,偷换概念

wall61

wall61

7
2025-02-11 12:08

是不是春节偷来的

早起鸟

早起鸟

7
2025-02-11 14:26

都算是有意义的探索!自从deepseek横空出世,各种各样的新思路都出来了!好。

赠光和日月

赠光和日月

7
2025-02-11 13:06

李飞飞讨厌至极!所做工作是说中国的Deepseek没有什么了不起?美国用50美元就可以做出来?美国更加厉害?

火星叔叔马丁 回复 02-11 15:05
话不是这么说的,这是侧面印证deepseek模型伟大之处[得瑟]

我开玩笑你当真

我开玩笑你当真

6
2025-02-11 16:30

这洋洋洒洒写这么多,国际开发署还给开工资呢么?

Even

Even

6
2025-02-11 13:11

我还0元下载

用户91xxx33

用户91xxx33

5
2025-02-11 14:04

不是断狗粮了吗?

用户91xxx09

用户91xxx09

5
2025-02-11 17:03

这就跟考古一样,只要中国有个大发现,要不了多久欧美考古也会有

用户73xxx36

用户73xxx36

4
2025-02-12 12:25

怎么又是有中国血统的人出来捣乱啦

打坏公司

打坏公司

4
2025-02-11 13:43

这娘们不像个好人呐?

蔚然上苍

蔚然上苍

4
2025-02-11 21:29

这说白了不就是个调用其他AI的东西么?脑子有问题的标题党。

倚劍醉紅颜

倚劍醉紅颜

4
2025-02-11 11:45

蒸馏的什么呢?哦,原来是蒸馏了chatgpt[呲牙笑],英文代码太臃肿了

鱼眼风云

鱼眼风云

4
2025-02-11 14:04

chatgpt怎么看,问过阿美主子了没有

normanchensz

normanchensz

3
2025-02-11 08:07

这狗屁叫兽那么牛,咋不自己开发一个?!

用户10xxx97

用户10xxx97

3
2025-02-11 15:03

xbb

维谷

维谷

3
2025-02-11 06:45

又是一个国贼。

Daniel

Daniel

3
2025-02-11 18:00

洋鬼子罢了,什么华裔[得瑟][得瑟][得瑟]

SMRSJW

SMRSJW

3
2025-02-12 00:30

这种小东西越多越好,反正恶心不了deepseek,倒能恶心GTP和特朗普搞的的那啥AI联盟

苏渔

苏渔

3
2025-02-12 02:07

金庸写射雕花了几年成本几十万,你照着抄了一遍用时一周,花费几只圆珠笔一打白纸 ,成本三块钱。

寂寞行者

寂寞行者

3
2025-02-11 16:13

目前阶段的Ai就是人工智障。普通人用顶多叫聊天机器人

四七

四七

3
2025-02-11 21:16

自带狗粮

ram128

ram128

3
2025-02-11 16:20

美国华人和大陆华人之间的对抗

中华神盾

中华神盾

3
2025-02-11 15:39

中美之争本质上是中国人和在美国的华人间的竞争

不良风气鉴定组

不良风气鉴定组

3
2025-02-11 12:24

标题党

用户10xxx57

用户10xxx57

2
2025-02-11 14:47

50美金一随便造一个软件都不止

用户10xxx34

用户10xxx34

2
2025-02-12 10:42

电费都不够,傻子还发文宣传

高飞

高飞

2
2025-02-12 01:42

胡说八道

冷月孤风

冷月孤风

2
2025-02-10 23:09

可以发通缉了,它盗版,

莫让浮云遮望远

莫让浮云遮望远

2
2025-02-11 10:52

两颊无肉不可交,这是个反骨仔。

木烟逸燃

木烟逸燃

2
2025-02-11 11:43

ds可以独立断网,你这50美金断网就成砖头了吧!

用户87xxx36

用户87xxx36

2
2025-02-10 21:58

专利霸权?

李师

李师

2
2025-02-12 08:53

这是给英伟达再捅一刀!给老特星际之门捅个大洞啊!坐实算力骗局

0o哦嗯额o0

0o哦嗯额o0

2
2025-02-12 09:51

我怎么感觉就是个搜索引擎[呲牙笑]

双生魂

双生魂

2
2025-02-11 10:48

这是直接复制改几个符号吧?有可能就直接不改了

小白兔

小白兔

2
2025-02-11 11:18

开源[笑着哭]

沙漠猎手

沙漠猎手

2
2025-02-11 16:23

据说小米已经在DeepSeek挖人了?这么快就向美国递了投名状?

飞鸟爱鱼

飞鸟爱鱼

2
2025-02-11 22:23

50,这是美工费用吧[得瑟]直接换个图标换个名字是吧

浮生若梦。

浮生若梦。

2
2025-02-11 16:43

胡扯早在2884年前就有中国人的几大爱唉模型就有了ds又不是新出来的

你大爷

你大爷

2
2025-02-12 08:50

抄作业吧

momo

momo

2
2025-02-11 18:10

哈哈哈,还吹

程玉

程玉

2
2025-02-11 20:56

两腮无肉,杀夫不用刀。

朝南的窗

朝南的窗

2
2025-02-12 12:37

尖嘴猴腮

十年

十年

2
2025-02-12 13:14

还AI教母,真是舔不要脸

雷达

雷达

2
2025-02-11 23:56

姑且当是真的,照这意思,英伟达会疯[呲牙笑]

若相惜

若相惜

2
2025-02-11 16:56

虚假宣传、根本跟DeepSeek和OpenAI就不是一回事!

panwang212

panwang212

2
2025-02-12 09:03

哪个华人帮美国,就是中国的敌人,就是数典忘祖的罪人,必将永远钉在历史的耻辱柱子上

★情罙缘淺

★情罙缘淺

2
2025-02-11 20:20

赶紧打钱[得瑟]

超级空格

超级空格

2
2025-02-12 10:37

骑着自行车上月球——和这个什么s1一个意思。

平常心

平常心

2
2025-02-11 20:29

面相两腮无肉,感觉是不好,懂面相的说一下

吹牛B队长

吹牛B队长

2
2025-02-12 07:49

我知道这个,听说是老美那边先诬陷deepseek是用数据蒸馏出来的东西,后来发现不是。就用数据蒸馏deepseek出来另一个东西,然后费用巨便宜……抄起来能不便宜么

BOBO

BOBO

1
2025-02-11 09:56

那么有钱能不能把牙齿整一下[笑着哭]

姑苏王

姑苏王

1
2025-02-12 12:21

黄皮人

用户95xxx95

用户95xxx95

1
2025-02-12 07:06

这个也算抄袭吧[得瑟][得瑟][得瑟]

放飞的码头

放飞的码头

1
2025-02-11 04:15

估计天网没多久就要出现了,赶快找未来战士吧

陈醉

陈醉

1
2025-02-11 21:26

切,又是华人。

用户18xxx02

用户18xxx02

1
2025-02-11 03:26

这是他们偷我们的!!!!

Samsung Galaxy S7 ed

Samsung Galaxy S7 ed

1
2025-02-11 21:12

她为什么不会出现在有DeepSeek的前面[得瑟]

专治苍蝇各种不服

专治苍蝇各种不服

1
2025-02-10 22:17

如果不用中文就缺少了灵魂

用户10xxx12

用户10xxx12

1
2025-02-11 09:59

虽然吹水,但依然是个汉间

不在

不在

1
2025-02-11 08:51

中国人的对手还是中国人

网络已不再帮谁

网络已不再帮谁

1
2025-02-11 17:28

老子这种文案,中国一旦出一个好点的东西。美国遥遥领先,不值钱都来了。

思善行

思善行

1
2025-02-12 10:04

能不能人才引进,把这个华人弄回来,放北大,清华带几批学生出来。

刺猬荆棘

刺猬荆棘

1
2025-02-12 05:51

50美元出一个,慌得不是DS。是GTP。我是不是可以认为美国其实并没有重视李飞飞?

用户11xxx74

用户11xxx74

1
2025-02-11 21:49

50美金,电费都不够,脑子正常点都不会信

狼牙

狼牙

1
2025-02-11 21:56

自己球都不懂 到处诋毁别人

想抽烟呢

想抽烟呢

1
2025-02-11 18:36

评论里居然还真有人信的,哈哈哈哈

用户10xxx25

用户10xxx25

1
2025-02-11 19:37

这智商最多也就值50美元了!

红绿灯前的螃蟹

红绿灯前的螃蟹

1
2025-02-11 22:37

扯淡,挂在别人大模型下敢说成本只有50美元,训练DeepSeek做到500万美元已经是优化再优化了,你说提升到百万美元级我也能信,50美元能给大模型喂几多数据?[并不简单][并不简单][并不简单]

金木水火土

金木水火土

1
2025-02-12 12:19

she是美锅人

胖胖

胖胖

2025-02-12 15:13

美国的顶尖模型是中国人开发的,尴不尴尬? 重视人才不是靠嘴巴😓

chatGPT

chatGPT

2025-02-12 08:05

理论上说这是种免费手段……

一个老头

一个老头

2025-02-12 01:31

舔狗开始舔了。

来科点谱

来科点谱

鸢飞唳天 聊点不知道的小事!