近日,国产AI DeepSeek在科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,相关话题登上热搜。
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超过了ChatGPT。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
DeepSeek刮起的旋风让硅谷大佬们心惊胆战,尽管美国媒体一直将deepseek淡化为另一个新的聊天机器人,但事实上,它在几乎所有基准测试中都优于美国同行的人工智能模型。
它的成本仅为600万美元,这更会他们精神错乱,这时侯尽快卖掉手上的英伟达股票或许还能保住收益,再犹豫就可能万劫不复了。
中国公司花费这么少的钱就创建了世界上最好的人工智能模型之一,而谷歌、微软等美国公司则花费了数十亿美元。
这暴露了西方吹泡泡式研发的问题,他们以利润为导向的创新方式或将被终结。DeepSeek 影响最大的并不只是 OpenAI 等 AI 研发厂商,而是冲击了整个产业链,尤其是目前市值高达3万亿美金的英伟达。
这是因为 DeepSeek 开源了仅需原来成本 20分之一甚至更低的算法。原以为今后 AI 靠拼算力,要几百万块 N卡的模式终结了。OpenAI 的奥特曼曾经多次宣称,其他公司基本是毫无希望赶上 OpenAI , 就是基于对计算成本的门槛估计,现在这个门槛已经被彻底打破。
StarGate 号称投资 5000亿美金,还没开启就陷入尴尬。硅谷很多小公司都在开始要卷起袖子投入基础模型的训练、开发。利用 DeepSeek 揭示的方法,有人在网上现场演示就能把一个原本呆板的模型训练成了思考模型。
人们突然发现,其实不需要这么的训练的算力,更多是需要已有模型的运用算力,所谓推理力。从投资角度,看好低功耗推理算力提供商与高带宽内存提供商。
为什么这个周末这个事情发酵的这么厉害,我说两件事,你们对比下:
前一阵OpenAI正式宣布启动星际之门(Stargate)计划,说这是一个前所未有的大规模人工智能基础设施建设项目,旨在在未来四年内投资高达5000亿美元,以巩固美国在全球人工智能领域的领先地位。
好了,中国这一波王炸。DeepSeek-V3模型的训练成本仅为 550 万美元。各项性能方面和OpenAI的对比几乎不输。最近更新的DeepSeek-R1甚至开始局部领先。所以,整个算力市场的预期就裂开了。
因为要把传统ai大佬们都要干趴下了,所以这个团队被传的很神秘,国外说他们是神秘高深莫测的一个团队,创始人梁文峰是浙大的高材生,手握双百亿的私募大佬(85年的)。
创始人说这个团队并不神秘,都是国内top高校毕业生和还没有毕业的博士生。又是一支“来自东方的神秘力量”。DeepSeek今早就在苹果APP位列下载榜第二名,价格只有gpt4的百分之几,被称作是“ai界的拼多多”“价格屠夫”。
“而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。”
DeepSeek的成功说明堆砌高性能显卡没有那么重要,而这对凭借AI显卡爆火的英伟达公司(Nvidia)来说不是一个太好的消息。受此影响,因人工智能显卡而如日中天的英伟达公司股价下跌超过3%。
DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。
因为更小的模型意味着更低的部署成本、更快的响应速度和更广泛的应用场景。在医疗、教育、制造等诸多领域,轻量级AI模型都将带来革命性的转变!
更让外媒震撼的是,DeepSeek的研究者,竟然全部都是中国本土人才,一个海外人才都没有!最近,DeepSeek大模型现世之后,外界纷纷怀梁文锋是雇佣了一批“高深莫测的奇才”,因为DeepSeek的技术太牛逼了,不是最顶尖的人才,根本做不出来。
不过最近梁文锋直接就在一个访谈中说出了真相,他只是淡淡一笑,说道:“并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。”
然后访谈者就惊讶了,因为现在所有中国公司,都认为大模型的顶尖人才是在海外,所以都是不惜花费重金,去招聘那些海外人才,甚至还有人说,人工智能这个领域的50名的天才,都不在中国的公司,都在国外。
对于此,梁文锋也是风轻云淡,平静说道:“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”
这个结果,太令人惊讶了,谁也想象不到,一个做出了震撼美国的科技成果的公司,其内部人才竟然全部都是中国的本土人才,一个海外的都没有!
很多人都说,中国的教育制度,导致中国出现不了有创新精神的天才,都是一些循规蹈矩的人,只会跟在美国的屁股后面跑,从来都搞不出“从0到1”的创新。
可现在,梁文锋的这一番话,毫无疑问是对这些言论的一个狠狠的打脸。尤其是他最后那一句,“我们能自己打造这样的人”,不得不说,太霸气了,这是真正的由内而外的自信风采。
梁文锋出生于1985年,这个年纪很小,可以说是年轻俊杰了。这样一个年轻俊杰,带领着一群中国本土的年轻人,其中都是一些应届毕业生,或者才毕业几年的学生,就这样创造出了一个震撼世界的产品,实在是太令人振奋,这就是我们中国的年轻一点啊,他们正在甚至是已经开始引领世界创新之潮流!
访谈的最后,梁文锋谈到从0到1的原创式的创新,还对此做出了一个判断,他用很笃定地语气说道:“以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。”
借这一段话,祝愿我们中国科技越来越蓬勃,中国的年轻人,未来定将引领世界科技创新之潮流,少年中国,与天不老,中国少年,与国无疆!