深度探索的成长和梁文锋的境界

洞察天下王欣说 2025-02-04 18:38:34

深度探索(DeepSeek,以下简称DS)的带头人梁文锋先生最近在国内外媒体上频繁出现,特别是他接受的专访、关于他本人的介绍等等,给我留下十分深刻印象的是他的思维境界。现摘录部分和大家分享,然后再谈我的感受。如摘录不准确,请各位指正。

梁文锋的部分言论归纳

关于创新

为了实现中国 AI 的自主创新,中国需要构建一个完整的 AI 生态系统。这不仅包括加大在技术研发上的投入,培养更多优秀的 AI 人才,还需要加强产学研合作,促进技术的快速转化和应用。只有当整个生态系统形成良性循环,中国 AI 才能真正实现从跟随到引领的转变。

在技术创新方面,DS 已经做出了积极的尝试,对模型架构进行了全方位创新,提出了崭新的 MLA 架构,将显存占用降到了极低水平,同时独创的 DS MoE Sparse 结构也极大地降低了计算量,从而实现了成本的大幅下降。这种创新精神,正是中国 AI 摆脱跟随地位所必需的。

我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年 IT 浪潮里,我们基本没有参与到真正的技术创新里。 我们已经习惯摩尔定律从天而降,躺在家里 18 个月就会出来更好的硬件和软件。Scaling Law 也在被如此对待。但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

创新首先是一个信念问题。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。为什么硅谷那么有创新精神?首先是敢。ChatGPT 出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国 AI 的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。中国 AI 不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

更多的投入并不一定产生更多的创新

关于公司

带领的 Deepseek 团队还有个很大的特点,就是人才密度高,而且团队成员大多来自中国本土市场,还很年轻。他们只招 1% 的天才,去做 99% 中国公司做不到的事情。梁文锋自己也很厉害,他日常就是看论文、写代码、参与小组讨论,是少有的能和一线研究员能力媲美的公司掌舵者。他一直坚持做通用人工智能,在模型结构层面做从 0 - 1 的创新,不做跟随策略。

关于公司愿景

抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。

因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

在颠覆性的技术面前,闭源形成的护城河是短暂的。即使 OpenAI 闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多 know-how,形成可以创新的组织和文化,就是我们的护城河。我们不会闭源,我们认为先有一个强大的技术生态更重要。

开源,发论文,其实并没有失去什么。对于技术人员来说,被 follow 是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。

当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在 DS 的基础上构建 to B、to C 的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

几点感想

期待更多有理想、有胸怀的企业家。在改革开放四十余年来,我国涌现了百万民营企业,也有大批企业家风光无限,但我们发现其中拥有大视野、大胸怀的、为社会进步做出有影响贡献的却寥寥无几,更多的是在完成了自己的脱贫致富、财富积累和企业追求之后,或告老还乡,或出走海外,或三妻四妾,或锒铛入狱,十分可惜。我们之所以敬佩任正非这样的企业家,不在于他的财富,更多的是他的骨气、担当和对国家、社会的贡献。

凡做大事者,必有大胸怀。今天我们看到梁文辉先生带领的DS怀抱为国为民的理想聚集一批年轻有为青年才俊,甚慰、甚喜!他们不仅对AI这个领域有深刻的认识,更有志向、有理想、有抱负,励志服务更多企业、更多人民,甚至是全球。相信,有这样的大胸怀,必能成大事,更会有更多的各方人士、企业向DS靠拢、聚集,打开一片新天地。

AI未来有望摆脱少数资本控制,为全人类服务。在DS横空出世之前,在AI领域和全球都弥漫着这样一个逻辑:AI是影响、改变未来科技和经济的新技术,更是需要大投入、大数据和高智商的产业,因而只能是个别国家里的少数大公司才能有这样的实力,它们掌握大量资金和核心技术,未来也就会掌握在它们的手中。这也就是许多人担心的AI资本主义。因为照此逻辑和模式走下去,许多发展中国家、许多中小企业和众多人民都会在个别国家的少数大公司控制的AI技术下寻找自己的出路和生活,这是绝大多数国家和人民不可接受的场景,也可以说是世界的灾难。

DS的成本优势、低价和开源,打破了个别国家的少数大公司的垄断,打破了其背后资本的盘算,而给大多数国家和人民开辟了新可能、新机遇,所以我们看到最近某国黑客潮水般攻击DS,同时又看到那么多的国家、平民百姓的欢呼和兴奋。

路漫漫,未来更艰辛。AI技术处于蓬勃发展的初期阶段,DS现在走出了第一步,未来还有很多困难和空间,DS及受DS鼓舞的企业、青年才俊还会有很大施展才华的机会和空间,加上某国不会就此罢休,会继续抹黑、遏制DS和我国AI产业的发展,未来之路必然艰辛险阻,一代人有一代人的上甘岭,现在我们尚未最终成功,还需继续加油努力!

团结一致,众志成城。DS的横空出世改变了世界AI格局,目前的局面来之不易。令人欣喜的是我国企业、个人自发联合起来,针对某国黑客大面积攻击进行了一场漂亮的阻击战,也看到DS和华为等公司进行紧密合作。

同时,DS也要认真梳理目前的成绩、明暗险滩,打铁还需自身硬,练好内功,加强内部管理、企业文化、企业战略和组织结构设计等,防止某米某军等人的拉拢拆台,防止某国的阴招损招,期待DS和中国AI及各个领域的青年才俊取得更大成就!

1 阅读:194
洞察天下王欣说

洞察天下王欣说

感谢大家的关注