太火爆了!DeepSeek服务被挤“宕机”,雷军千万年薪挖角的“天才少女”曾是开发者之一

红星资本局 2025-01-27 12:30:54

红星资本局1月27日消息,今日,国内AI初创公司DeepSeek官网显示,DeepSeek网页/API不可用。1月26日,DeepSeek就曾出现短时闪崩现象。

据DeepSeek回应,其服务再次“宕机”,源自新模型发布后,用户访问量激增所致。

2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。该模型在AI圈爆火后,DeepSeek-V2的关键开发者之一罗福莉走进大众视野,被称为95后AI“天才少女”。据悉,小米创始人雷军在DeepSeek-V3发布前几天,已开出千万元年薪招揽罗福莉,领导小米AI大模型团队。

用户访问量激增致宕机

雷军曾千万年薪挖角“天才少女”

1月20日,DeepSeek发布新模型DeepSeek-R1并同步开源模型权重,再次引发全球AI科技圈关注。

据界面新闻报道,1月26日,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

图据界面新闻

在此之前,DeepSeek就曾在圈内吸引过一波关注。

2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源模型不分伯仲。

同时,由于其极低的训练成本,DeepSeek-V3被称为“AI界拼多多”。

公开资料显示,DeepSeek来自杭州深度求索人工智能基础技术研究有限公司(下称“深度求索公司”),专注于开发先进的大语言模型和相关技术,由国内知名量化资管巨头幻方量化于2023年7月创立,也因此获得资本市场的广泛关注。

彼时,DeepSeek-V2的关键开发者之一罗福莉也火出圈,被称为95后AI“天才少女”。公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。

图据“罗福莉”微信公众号

硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

就在DeepSeek-V3发布前几天,小米创始人雷军已开出千万元年薪招聘罗福莉,领导小米AI大模型团队。

登顶苹果美区应用榜

多岗位招新,实习生日薪最高上千元

DeepSeek的爆火后,登顶苹果中国和美国应用商店免费APP下载排行榜,超越了ChatGPT。

DeepSeek公众号显示,DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出 tokens 16元。

据澎湃新闻报道,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列。不过,DeepSeek-R1的预训练费用为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。

红星资本局通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。

其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。

值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

截图自BOSS直聘

红星新闻记者 杨佩雯

编辑 邓凌瑶

(下载红星新闻,报料有奖!)

23 阅读:12058

评论列表

芋圆圆

芋圆圆

20
2025-01-27 13:37

网页服务器短时间遭受大量访问请求,包括API调用数据库,服务器处理不过来。也有可能别有用心的人大量DOS攻击。服务器短时间处理不了被迫宕机。这个不关ai算法的事,ai算法调用的GPU,而服务器处理请求调用的是CPU。

啥都搞搞

啥都搞搞

11
2025-01-27 15:59

没有什么好不吹的,用的openai数据做的二次开发,技术叫蒸馏技术

中秋的孔明 回复 01-27 18:53
你跪太久了,心也太狭隘了,看不得自己人好。人家公布了自己的论文DeepSeek R1技术报告论文《DeepSeek-R1:强化学习驱动的大语言模型推理能力提升》其代码和训练方法的完全开源。将模型的源代码和技术细节公开,并允许用户根据其自身需要对模型进行任意使用和修改。今天27日再创历史时刻:力压ChatGPT,登顶美区App Store免费榜,在国内App Store免费榜同样位居第一。历史上首次有一款APP 能在苹果中国和美国地区应用同时排在免费APP下载排行榜第一的位置,在美区下载榜上超越了ChatGPT。英伟达美股盘前一度跌超8%,主导星际之门计划的软银集团股价一度下跌近6%,足以说明deepseek的强大

A 中信祥祥 回复 01-28 00:14
现在开盘英伟达已经暴跌12%

loft live

loft live

9
2025-01-27 13:42

就怕最后水落石出和“汉芯”一个结局

Mor 回复 01-27 22:32
别急着泼冷水,汉芯还没投入实用,deepseek已经公开使用了[得瑟]

冬

8
2025-01-27 14:11

真搞不明白,这玩意说到底还是软件,咋就把自家的硬件,给吓尿了呢?

月光镞 回复 01-28 09:28
之前使劲吹硬件股价狂升,现在发现硬件过剩了能不跌吗?

早早要起早

早早要起早

8
2025-01-27 16:05

今大半天DeepSeek忙到只能回复不好意思[捂脸哭][呲牙笑][点赞]

lu15444985

lu15444985

7
2025-01-27 15:26

广告?

错过 回复 01-27 15:55
和黑神话一样,肯定是有运营和推广的。

A 中信祥祥 回复 错过 01-28 00:15
英伟达已经连续暴跌了,今天再次开盘跌12%

姑苏一杯倒

姑苏一杯倒

4
2025-01-27 14:30

刚用过没问题 美帝高价芯片其实就是一堆沙子!

小的木

小的木

3
2025-01-27 18:47

试用了一下,Ai出来的文章确实不错

月章

月章

3
2025-01-27 17:10

刚才还用,没问题啊。。。

青云青州

青云青州

2
2025-01-27 13:39

弯道超车,后起之秀[点赞]

s梦毁她乡i6K

s梦毁她乡i6K

2
2025-01-27 14:01

无论怎样,先把气氛搞起来,[捂脸哭]

婉言

婉言

2
2025-01-27 15:31

这玩意也没啥,就是把百度的东西分析汇总一下吧!

Mor 回复 01-27 22:33
你好像没搞明白

梦魇绽荼蘼

梦魇绽荼蘼

2
2025-01-27 15:30

准备了一桌菜,结果来了一屋子人,不宕机就有鬼了

如晴天 似雨天

如晴天 似雨天

2
2025-01-27 19:08

实业救国[静静吃瓜]

思念的滋味

思念的滋味

1
2025-01-27 14:51

我已经下载了,非常亮眼的应用,逻辑算力超级棒,符合国人思维方式[比心][比心]

红星资本局

红星资本局

聚焦资本市场,专注上市公司。