近期,一个国产的AI大模型突然火了。
短短一个月内,中国初创公司深度求索(DeepSeek)的两款大模型DeepSeek-V3和DeepSeek-R1横空出世,瞬间“搅动”硅谷,让一向以AI领先自居的美国人都坐不住了。
美国CNBC电视台在报道此事时,直言:
“一种新的模式,让整个山谷都嗡嗡作响!”
消息传开,AI大佬们也纷纷发声:
科技巨头扎克伯格称 DeepSeek 非常先进,中美AI差距非常小。
AI数据服务公司Scale 的创始人Alexander Wang就发帖称:
DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。
华尔街顶级风投A16Z创始人安德里森更是发文盛赞:“DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是送全世界的大礼。”
DeepSeek爆火的原因,在于它打破了美国AI两大霸主的神话:
一家是卖GPU的英伟达,一家是CHATGPT聊天应用。
DeepSeekV3展现出了令人瞩目的优势,只需要1/20的GPU数量,就能达到OPENAI公司大模型的性能,训练费用更是断崖式下跌,连OPENAI公司的零头都不要。
然而,真正让美国硅谷感到震撼的,并非仅仅是DeepSeek所展现出的高性能、低成本特性,而是中国人展现出的首创精神。
长期以来,在全球科技领域的固有印象中,中国AI公司似乎总是在复制硅谷模式,普遍认为美国擅长从0到1的技术突破,而中国只擅长从1到100的应用落地。
但DeepSeek的出现打破了这种成见,它凭借MLA、DeepSeekMoE等多项开创性技术,大幅提升了模型的性能和训练效率,因此被硅谷誉为来自东方的神秘力量。
这一现象引发了全网的强烈好奇,就连小红书上都有人发帖询问:这究竟是怎样的一支神奇的团队?
其实,很多人并不知道Deepseek是何方神圣,但只要一提幻方量化,应该就知道了。
DeepSeek 正是幻方量化旗下的子公司。
过去几年,幻方量化与九坤投资、明汯投资、灵均投资一同被誉为量化私募领域的“四大天王”,依靠量化交易在二级市场赚得盆满钵满。
DeepSeek 于 2023 年成立,是一个十分纯粹的本土创业公司,
执掌这支团队的灵魂人物是80后的梁文峰,也是幻方量化的创始人。
梁文锋本硕均就读于浙江大学信息与电子工程学专业,早在中国量化投资萌芽阶段时,他就率先将机器学习技术应用于全自动量化交易,成功开创了行业先河,并斩获金牛奖,这可是中国私募证券领域的最高奖项。
2023年,幻方量化决定进军大模型领域,并将这个独立的新组织命名为深度求索,并强调将专注于打造真正达到人类级别的人工智能。
梁文峰在中国AI界堪称一位独特的存在,他非常重视技术的原创度,拥有超强的学习能力,即便在取得诸多成就之后,依旧延续着低调务实的作风。直至今日,他依然和公司其他研究员一样,每天看论文,写代码,参与小组讨论。
DeepSeek的成功,不仅得益于其强大的技术研发实力和源源不断的创新能力,梁文锋独特的人才管理策略同样功不可没。
他精心组建的是一支纯粹的本土研发团队,团队成员清一色为中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人,其中来自清北的应届生表现得非常活跃,曾被以雷军千万年薪挖的95后天才AI少女罗福莉,此前便是梁文锋旗下团队的核心研发成员之一。
在团队管理方面,DeepSeek并不看重学术荣誉和论文发表量,有些团队成员在2024年一边在DeepSeek搞研究,另一边博士学位论文刚评上奖。
就是这样一支看似平凡却充满潜力的团队,用极少的成本,成功打造出国外大厂烧钱数倍才能做出的产品。
在梁文峰的带领下,DeepSeek正逐渐成为AI领域的一股中坚力量,为中国在全球AI竞争中赢得了一席之地。
回顾中美科技产业的发展历程,我们常常感慨中国为什么出不了像乔布斯、马斯克、黄仁勋一样伟大的企业家?
如今,在梁文峰身上,我们依稀看到了这些传奇人物的影子。
他正以坚定的步伐,带领中国AI走向世界前沿,书写属于自己的传奇篇章 。