DeepSeek创始人梁文锋,广东人,仅靠百名中国程序员,赶超OpenAI

CEO看科技 2025-01-19 19:12:39

今天介绍一位金融和人工智能领域的创业者梁文锋,他是幻方和深度求索(DeepSeek)两家公司的创始人。

即刻网友@Chris-Su对梁文锋的评价我觉得很到位:

“梁文锋是极少数还没被‘广泛解读和学习’的顶级CEO。”

近期“雷军千万年薪挖95后天才AI少女”的热门话题也间接的与梁文锋有关,因为雷军尝试挖走的这位90后少女罗福莉此前正是梁文锋旗下深度求索(DeepSeek)团队的研发成员。

梁文锋创办的幻方量化基金目前的管理资金规模超过百亿,2021年还一度突破千亿元规模;而他创办的深度求索(DeepSeek)公司,也是国内少有的拥有万卡集群算力的AI大模型公司,研发实力和成果在最近也震惊了许多国外AI同行。

梁文锋的深度求索(DeepSeek)公司被称为“AI界的拼多多”,原因是这家公司的出现极大地降低了大模型训练和应用的成本,如该公司开发的DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距。

DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,可以说是性价比超高。

并且梁文锋的深度求索(DeepSeek)团队只有139名研发人员,而开发ChatGPT的OpenAI团队则有1200名研究人员。

在这样亮眼的成绩背后,梁文锋的低调就显得更神秘了。

今天我们就用1分钟时间,来了解一下幻方和深度求索(DeepSeek)这两家公司的创始人梁文锋的个人履历和创业故事:

1985年,梁文锋出生于广东湛江,据36氪暗涌报道梁文锋说自己的出生地是广东一个五线城市,不过CEO来信君查了查,湛江目前应该是三线城市。

梁文锋说过自己的父亲是一名小学老师。可惜梁文锋就读的小学、中学均没有公开信息。只知道他是一位数学建模爱好者。(也有朋友留言说他是湛江吴川人,毕业于吴川一中)

2002年,17岁的梁文锋考入了浙江大学电子信息工程专业。

2002年9月至2006年6月,梁文锋来到浙江杭州,在浙江大学电子信息工程专业读本科。

2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,主要做机器视觉研究。

梁文锋的求学历程

2008年,在浙大读书期间,23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。

这一年梁文锋也带领团队开始使用机器学习等技术探索全自动量化交易。而此时,正值全球金融危机。

有传闻称浙江杭州人、大疆创始人汪滔也曾邀请过梁文锋一起创业,当时也是大疆起步期,如果梁文锋加入的话,可能也同样实现财富自由了。梁文锋很早就相信人工智能会改变世界,最终他还是选择自己创业。

2010年6月,25岁的梁文锋从浙江大学信息与通信工程专业硕士毕业,他的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

2008年至2014年,梁文锋一直在探索全自动量化交易。

2013年,28岁的梁文锋与同样来自浙江大学的同学徐进一起创办了杭州雅克比投资管理有限公司。

2015年4月,中证500股指期货上市。这也标志着中国量化私募进入2.0时代。量化基金拥有了更强大的量化工具,对冲手段的丰富让资本市场的价格发现功能更完备,市场由纯多头变得更加立体化。

2015年6月,30岁的梁文锋与徐进一起加入阳光私募大军,在浙江杭州创办了杭州幻方科技有限公司(公司英文名High-Flyer),也就是现在的浙江九章资产管理有限公司。梁文锋及其团队开始依靠数学与人工智能进行量化投资,立志成为世界顶级的量化对冲基金。

此图来自幻方官网

2015年,国内还曾发生“股灾”,梁文锋团队采用的高频量化投资策略也让他们取得了不错的成绩。当时他们公司只有10张GPU显卡。

2015年10月,梁文锋他们甚至带领幻方量化在一天内成立了10只产品。同年12月,又成立了另外10只产品,快速提升了自身的募资能力。

2016年2月,梁文锋与徐进又成立了宁波幻方量化投资管理合伙企业(有限合伙)。

幻方量化在这一年加入了中基协(中国证券投资基金业协会),意味着他们在行业内的专业性和规范性得到了官方认可。

2016年10月21日,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行,使用GPU进行计算,在此之前,梁文锋团队的算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。

2016年梁文锋31岁,到年底时,他们管理的资金规模已经大约10亿元。

2017年,32岁的梁文锋带领幻方继续扩大AI算法研究团队和AI软硬件研发团队,到2017年底,几乎所有的量化策略已经都采用AI模型计算。他们管理的资金规模也扩大到30亿元。

2018年,梁文锋确立公司以AI为主要发展方向,幻方量化也首次获得了私募金牛奖——这是中国私募证券领域的最高奖项。

此时幻方量化也遇到了算力瓶颈,日益增加的训练需求受限于有限的计算资源,梁文锋开始寻求大规模算力解决方案。

2019年,梁文锋创办幻方AI公司,投资2亿元自主研发深度学习训练平台“萤火一号”,为此搭载了1100块GPU显卡。

此时34岁的梁文锋已经带领幻方量化成为管理资金超百亿的私募。这一年幻方资本也在香港成立,并获得香港九号牌(即资产管理牌照)。

梁文锋在金牛奖颁奖典礼现场

2019年8月30日,34岁的梁文锋在金牛奖颁奖仪式上,发表主题演讲《一名程序员眼里中国量化投资的未来》,引发金融从业人士热议。

在演讲中,梁文锋指出量化与非量化的判定标准就是在投资决策的过程中,是用数量化方法进行决策的,还是用人进行决策的。量化公司是没有基金经理的,基金经理就一堆服务器。

梁文锋透露,“作为私募,投资人对我们的期望是很高的,如果一年跑赢指数低于25%,投资人是不满意的。”他当时坦诚压力很大,但收的手续费也很高。

梁文锋指出量化投资已经赚了技术面流派原来赚的钱,未来也要抢夺基本面流派原来赚的钱。

演讲最后,梁文锋说幻方量化的使命就是:提高中国二级市场的有效性。

2020年,“萤火一号”投入使用,其寿命为1年半。

一位幻方量化的员工曾在公司博客中写道,老板本人每天都在写代码、跑代码。这是他们与其他公司的不同之处。

2021年,梁文锋36岁,这是他和幻方命运的转折之年。这一年他们还斥资10亿元建设“萤火二号”。

2021年2月,《征服市场的人:西蒙斯传》出版,梁文锋曾为此文作序,他在书中写道:每当在工作中遇到困难的时候,我会想起西蒙斯的话“一定有办法对价格建模”。

注:詹姆斯·西蒙斯是量化投资领域的泰斗,创办了文艺复兴科技公司和大奖章基金。西蒙斯的投资战绩如下:

从1988年到2018年,大奖章基金的年化复合收益率接近40%,扣除费用后年化回报率为39%,超过了巴菲特和索罗斯等投资大佬。在1994年至2014年中期,大奖章基金的平均年回报率高达71.8%。2000年互联网泡沫期间,大奖章基金获得了98.5%的净回报。2008年全球金融危机期间,大奖章基金依然获得80%的收益。

2021年8月,梁文锋带领幻方量化的资金管理规模突破千亿大关,正式跻身千亿量化私募之列。

幻方量化与九坤投资、明汯投资、灵均投资一起,因管理资金规模均超过600亿元,被业界称为量化私募领域的“四大天王”。

在梁文锋的带领下,幻方量化用4年时间成为了百亿量化私募,然后又仅用2年时间成为千亿量化私募,速度确实非常快。

不过2021年11月,由于业绩波动,幻方量化关闭了全部募集通道,并在12月底发布致投资者公开信,致歉称“幻方业绩的回撤达到历史最大值,我们对此深感愧疚”,究其原因,主要是人工智能投资决策在买卖时点上没有做好。

媒体报道,幻方量化也曾在一个半月内主动缩减了超100亿元的管理规模,从近千亿规模降至800多亿的规模。此后幻方逐渐降低其资金管理规模。

当时有投资者说,看见陆某(幻方高管)这个名字就下意识想要打人。对此陆某在朋友圈致歉说:

“想和投资者说,最近几个月跑得不好,十分抱歉。我们正在全力加班加点做研发,但的确需要一点时间。这种时候,投资者不难受是不可能的,所以骂我们完全接受。就是千万莫动手哈,就算动手也别打脸,消消气,手下留情,等我们重振旗鼓。”

2021年,梁文锋还带领幻方先于一些云厂商拿到英伟达A100显卡,并且其AI集群搭载显卡的数量达到“万卡级别”。有报道称,当时国内超过1万枚GPU的企业不超过5家,而且除了幻方之外,其他4家公司都是互联网大厂。

英伟达创始人黄仁勋介绍显卡产品

2022年,私募基金公司上海锐天投资曾起诉梁文锋的公司幻方量化,很可能与员工跳槽,存在竞业协议有关。该案的另外一名被告杨某,曾担任上海锐天投资高频策略研发部门的负责人,被认为掌握着公司的核心商业秘密,即量化交易策略代码。

2022年,幻方量化的一名员工以“一只平凡的小猪”的名义向慈善机构捐款1.38亿元,其中获得扶持的项目包括白血病救助、乡村工匠、高中生助学、儿童大病救助、听障儿童支持、关爱老兵等。

外界猜测这位“一只平凡的小猪”就是37岁的幻方创始人梁文锋。

图片来自幻方官网

2023年5月,38岁的梁文锋宣布要做通用人工智能(AGI)。

2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司。

梁文锋被认为是量化投资者投身AI创业的“第一人”,实际上在幻方创业时,梁文锋的公司也早就用上了AI技术。

2023年10月底,梁文锋的创业伙伴徐进因为个人家庭事务处理不当,引发负面,被公司给予停职处理。当时幻方量化的管理规模已经降到了400多亿元。

2024年5月,39岁的梁文锋带领深度求索(DeepSeek)发布了混合专家语言模型DeepSeek-V2。

DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一。

DeepSeek-V2模型发布后,字节跳动、阿里巴巴、百度、腾讯等大厂纷纷宣布大模型产品降价。因此,深度求索(DeepSeek)公司也被称为AI界的拼多多。

2024年10月,梁文锋的幻方量化向投资者发布公告,宣布未来会逐步将对冲产品投资仓位降低至零。

2024年12月26日,梁文锋又带领深度求索(DeepSeek)公司发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。

深度求索(DeepSeek)公司官网显示,DeepSeek-V3的多项数据“吊打了”国内外一众大模型产品,更关键的是它还便宜。被称为“来自东方的神秘力量”。

DeepSeek-V3的各项测试结果与同行对比

OpenAI创始成员Andrej Karpathy在看到DeepSeek的成绩之后,毫不吝啬地表达了赞赏,他认为深度求索(DeepSeek)在资源受限的情况下展现出了极高的研究和工程能力。

难能可贵的是,梁文锋组建的还是一支纯粹的本土研发团队,只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人。

甚至有报道称深度求索(DeepSeek)团队不招聘高级技术专业人员。员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。

有业内人士一语中的:“创新需要摆脱惯性。”

比如深度求索(DeepSeek)的朱琪豪是2024届北大计算机学院软件研究所博士毕业生;代达劢是2024年北京大学计算机学院计算语言所的博士毕业生;郭达雅是2023年中山大学博士毕业生……

有不少人是在深度求索(DeepSeek)公司实习时做出了重要贡献。

OpenAI公司也有类似的倾向,他们招聘时会优先考虑没有学术荣誉的高潜力新人。

梁文锋曾对36氪暗涌说:

“如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”

做深度求索(DeepSeek)这家公司时,梁文锋也意识到了按照他们的研究方法,是没有VC愿意投资的,因为VC有退出需求,会希望创业者尽快做出产品商业化。所以梁文锋在AI大模型领域探索的资金,主要还是依靠他的幻方公司在支持。

2025年,梁文锋的幻方量化资金管理规模已经小于300亿元,退出了行业前6名。

2025年1月10日,在西藏日喀则发生地震后,幻方量化向灾区捐赠了100万元救灾款。

值得一提的是,雷军真的挖走了90后天才少女罗福莉吗?深度求索(DeepSeek)的一篇论文显示,罗福莉的确已经从深度求索公司离职,但她有没有加盟小米,还有待进一步确认。

罗福莉已从DeepSeek团队离职

梁文锋也非常重视技术的原创度,他对36氪暗涌说:

中国必然需要有人站到技术的前沿。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。真正的差距不是一年或两年,而是原创和模仿之差。

如今在梁文锋的带领下,中国的大模型公司真的很有希望与美国同行们PK一下了,这在美国限制芯片销售的背景下,显得尤为可贵。

小结:

梁文锋从一开始做幻方,就想要用技术驱动的方式,这是他对人工智能的信仰,对詹姆斯·西蒙斯的崇拜。

选择金融场景去应用AI技术,也为他后来积累更多财力去研究创新打下基础。

有趣的是,梁文锋每次创业都会历经资本寒冬的考验。

无论是2008年开启探索量化交易,还是2015年创办幻方进入私募领域,还是2023年切入AI大模型赛道,这三个年份都被外界认为是“资本市场的寒冬期”,但梁文锋总能在寒冬期启动,并迅速取得不俗的成绩,给人一种遇险则强的感觉,真的是打铁还需自身硬。

在实现财富自由之后,梁文锋把目光瞄准AI大模型,他将深度求索(DeepSeek)公司看作一种好奇心驱使的探索、学术研究,而非商业利益的追逐,所以他才会把技术开源。

此外,梁文锋不拘一格降人才,总能发现潜力选手,以及公司管理不设KPI,鼓励员工自由发挥等特点也让人印象深刻。

梁文锋才将将要40岁,但他对人工智能技术的笃定与沉稳,让人心生敬畏,确实有顶级CEO的气质。

1 阅读:192
CEO看科技

CEO看科技

感谢大家的关注