梁文锋落子DeepSeek的隐秘故事

智东西 2025-03-03 20:51:47

作者 |  程茜

编辑 |  心缘

春节期间一夜震惊全球的DeepSeek,让杭州一跃成为全国“顶流”。当大众的目光都聚焦于杭州时,却很少有人知晓,DeepSeek旗下最早注册的公司位于北京,直到2个月之后杭州深度求索才成立。

现在,DeepSeek位于北京的办公室,更是每日门庭若市、访客如织。智东西带着诸多疑问,走访DeepSeek位于北京海淀区的融科资讯中心的办公室,并与多位了解DeepSeek情况以及曾经在DeepSeek工作过的人士交流,发现这家火爆全球的公司背后很多不为人知的故事。

DeepSeek的公司主体虽坐落于杭州,但它在北京的子公司,却在海淀霸气地包下了融科资讯中心一整层楼,占地面积达2100平方米左右。

据了解,DeepSeek目前员工数量为160人,即使都就职在北京,若按70%来计算写字楼的使用面积,人均办公面积最少能达到9平方米。如此宽敞的办公环境,对创业公司而言十分罕见。

不仅硬件条件堪称 “豪华”,DeepSeek的工作氛围也极为宽松。在如今竞争激烈、节奏紧凑的职场环境下,其招聘以应届生为主,且员工无KPI、不打卡,以兴趣导向为主。

宽松的办公环境背后,梁文锋在薪资方面出手颇为大方,幻方量化资深数据科学家年薪是竞对两倍,DeepSeek在招岗位年薪已经过百万。

智东西根据公开信息梳理了DeepSeek员工毕业院校发现,DeepSeek北京大学毕业学生数量多于清华大学。有知乎网友认为,这是由于北大学生找实习宁愿去小公司,也不会选择清华系AI企业。

此前被称为“杭州六小龙”爆火出圈,为何主要研发团队位于北京?北京与杭州公司发展不同之处是什么?DeepSeek的成功与其选人、用人标准有何关联?这种近乎“理想化”的工作模式,究竟是如何实现的?我们试图通过公开信息和走访相关人士,来找到这些问题的答案。

一、DeepSeek开启时代转折的关键选址,北京是起点

在梳理DeepSeek的发展脉络时,一条隐藏在时间长河中的神秘线索逐渐浮出水面,用八个字概括就是——北京开花,杭州结果。

通过梳理这家公司成立的时间线,我们发现,DeepSeek的公司主体最早于2023年5月在北京成立,名叫北京深度求索人工智能基础技术研究有限公司(下称北京深度求索),比目前DeepSeek的主体公司杭州深度求索人工智能基础技术研究有限公司(下称杭州深度求索)早两个月。杭州深度求索成立于2023年7月。

有意思的是,在成立初期,杭州深度求索是北京深度求索的全资子公司。

不过更有意思的是,2023年8月,这两家公司角色发生对调。

北京深度求索将股权全部转让给宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋,杭州深度求索注册资本从100万元增至1000万元。

▲北京深度求索股权变更信息(左)、杭州深度求索股权变更信息(右)

自此形成了现在DeepSeek的布局,杭州深度求索是DeepSeek主体公司,北京深度求索是子公司。

春节以来,北京深度求索所在的融科资讯中心成为各路玩家打卡的热门地点。

从地理位置来看,融科资讯中心周边的高校、知名公司众多。周边聚集清华大学、北京大学、中国科学院等40余所知名高校和研究院所,园区内还有苹果、微软、AMD、英伟达等全球市值名列前茅的科技公司以及一众国内科技创业公司。

▲融科资讯中心周边(图源:百度地图)

2024年5月,DeepSeek入驻融科资讯中心,并包下了一整层楼,面积约2100平方米左右。新希望集团董事长刘永好最近透露,在和DeepSeek创始人梁文锋交流中获悉,DeepSeek目前员工人数为160人。也就是说,即使所有员工都就职北京,若按70%来计算写字楼的使用面积,人均办公面积最少也能达到9平方米。

尽管DeepSeek的公司主体位于杭州,但是我们研究发现,DeepSeek的大部分的研发人员、研发进展都在北京完成。

天眼查显示的员工体量中,DeepSeek的整体规模并不大,且相比之下,杭州主体公司比北京更小。

基于天眼查大数据模型,结合不同行业企业的经营数据,如企业的资产总额、经营利润、人员规模等(其中上市/发债企业以合并报表口径),综合计算形成的L(大型)、M(中型)、S(小型)和XS(微型)四类企业规模分类体系,北京深度求索为中型,杭州为微型。

两个公司的体量有明显差别。这可以看出,该公司的业务、研发重心可能都在北京。

有意思的是,DeepSeek目前拥有多个域名,其中deepseek.cn于2023年9月4日在北京进行了ICP备案(互联网信息服务备案),而deepseek.com是2024年1月23日才在杭州完成备案。

对于大模型企业而言,算法备案和大模型备案至关重要,这是企业能将模型向公众开放服务的两个必要条件。

目前来看,DeepSeek算法备案已经在北京和杭州先后完成,时间是分别是2024年4月和2024年6月。

大模型备案2024年5月在北京通过。这或许与北京市在全国大模型备案方面的布局是最早一批相关,2023年8月北京市就已经披露首批通过备案的大模型。

另外一个有意思的是,DeepSeek的两家商标代理机构均是北京企业。

可以看到,初期DeepSeek的发展与北京密不可分。

二、独一无二的制胜之道:应届生扛大梁,梁文锋本人除了编程没其他爱好

同在顶尖人才聚集“包围圈”,为何DeepSeek率先冲出来并改变整个大模型产业的竞争格局?种种迹象表明,或许DeepSeek别具一格的员工体系以及梁文锋身上独特的人格魅力,暗藏着某种制胜密码。

值得一提的是,坐落于名校聚集地的DeepSeek,其员工中清北等北京知名高校的含量极高。

2023年5月,DeepSeek创始人梁文锋曾在接受暗涌Waves采访时提到,DeepSeek的核心技术岗位,基本以应届和毕业一两年的人为主。据一位曾在DeepSeek实习的学生回忆,DeepSeek招聘时以应届生为主,学历是硕博、工作背景为大语言模型相关。

据智东西不完全统计,DeepSeek已经发布的论文的作者名单中,其中有超过一半员工仍就读或毕业于北京大学、清华大学、北京师范大学、北京邮电大学、北京航空航天大学等知名高校。此外其员工还有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校,大部分都具有交叉学科背景。

例如,DeepSeek上月发布的一篇最新论文,第一作者就是北京大学硕士研究生袁景阳,他在DeepSeek实习时是DeepSeek-V3技术报告的主要作者之一,还参与了DeepSeek-R1项目;DeepSeek-V2的关键创新MLA架构由北大和北邮的毕业生主导研发;盛传雷军千万年薪挖掘的DeepSeek 95后AI天才少女罗福莉也毕业于北大……

▲DeepSeek最新论文

目前公开的招聘信息也呈现出这一趋势。

从招聘平台Boss直聘上的公开信息来看,目前DeepSeek的招聘岗位共有34个,涉及大模型全栈工程师、深度学习研发工程师等核心技术人员,从数量来看北京招聘岗位有24个,杭州有10个。

除了员工构成外,DeepSeek的整个管理模式也与众不同。

北京通用人工智能研究院助理院长郑卿告诉智东西,从DeepSeek的员工结构来看,他们在选人时打破传统标准,以年轻人为主,且相比于资历、经验,更看重人的能力和对工作的热情。

与很多CEO不一样,创始人梁文锋会深度参与一线工作。她补充说,DeepSeek的管理扁平化,DeepSeek创始人梁文锋会在一线,没有分级管理模式。微信公众号聪明投资者的文章就提到,2018年同事对梁文锋的评价就是——除了编程,没有什么其他的爱好。

拥有顶尖的人才,并能有效激发其创新活力,与DeepSeek这种独特的员工结构相辅相成。

三、梁文锋打造“研发乌托邦”:百万年薪,无KPI不打卡

如此宽松的办公条件,又营造出了如何独特的工作氛围?这也是DeepSeek崛起之路上拼图的关键碎片。

查阅公开信息可以发现,DeepSeek在北京的注册地点一开始在北京市海淀区丰慧中路7号新材料创业大厦,同年11月变更至北京市海淀区科学院南路2号的融科资讯中心,并于2024年5月正式入驻。

据了解,广纳国际顶尖公司的融科资讯中心占地共8公顷,总建筑面积有32.8万平方米,但容积率仅为3.1,且是北京市四环内唯一绿化率达到42%的园区。

由于此时想要拜访DeepSeek的各路人士非常多,因此其物业公司还在DeepSeek所处楼层单独加装了闸机,并增设了安保人员。

硬件条件拉满,公司的办公氛围较为轻松。

据曾在DeepSeek实习的学生透露,他们没有固定上下班时间、没有KPI。工作模式以小方向、兴趣导向为主,每周定期讨论研究进度。

谈及对梁文锋的印象,他补充说,梁文锋对员工没有约束,会参加公司的主要项目研发,且在保证工作的前提下,会提供更多福利,给实习生的额外补贴。

▲DeepSeek创始人梁文锋

2023年5月,梁文锋曾在接受暗涌Wave采访时提到,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。

一位去年9月离开DeepSeek的员工说:“梁文锋给了我们控制权,把我们当作专家对待。他不断地提出问题,并与我们一起学习。DeepSeek让我负责核心研发部分,这非常令人兴奋。”

这样的人才结构、公司氛围对于DeepSeek这样偏研发型、产品层面工作并不复杂的公司而言更为适合。

北京科学智能研究院副院长李鑫宇解释说,AI发展到今天,对于人才的学习能力、动手能力要求更高,这一背景下,仍处于大学或刚毕业的学生其这两大能力正处于巅峰状态,且受到外界约束更少,因此也是这类人群在以算法创新为主的创业公司DeepSeek中,更适合做出突破性成果的形式。

因此,DeepSeek的招人要求更看重——基础能力、创造性、热爱等。梁文锋说:“从这个角度看,国内合适的候选人就不少。”

除此以外,梁文锋在薪资水平上颇为豪气。曾有熟悉梁文锋的量化基金经理透露,在幻方量化,资深数据科学家年薪150万元并不罕见,而竞争对手的年薪很少超过80万元。

从目前DeepSeek公开的招聘信息可以看出,其在招的深度学习研究员-AGI‌月薪8万至11万元,年薪最高可达154万元‌,‌核心系统研发工程师(校招)‌月薪6万元至9万元,按一年14薪估算后,年薪最高可达126万元‌,‌大模型全栈工程师‌月薪5万元至8万元,年薪最高可达112万。

四、扎根AI人才“富矿”,政府千亿投资基金已落地

在AI产业这片顶尖人才激烈角逐的“战场”上,人才无疑是决定企业命运的关键因素。从这个层面来看,DeepSeek将研发重心放到北京有一定的必然性。

国内AI相关学科的建设相比发达国家仍有一定差距。2022年教育部发布《研究生教育学科专业目录》,将智能科学与技术设立为交叉学科门类中的一级学科。

郑卿谈道,事实上,当前国内顶尖的AI人才在我国整个就业市场上仍处于稀缺状态,人才的自主培养就更显紧迫。人才培养是一个长期的过程,可以从课程设置、师资与应用实践等方面着手,致力于培养跨领域复合型的顶尖人才。

在人才稀缺与AI产业发展加速的背景下,北京在AI人才方面的领先优势就更为受到关注。

一直以来,北京都是AI人才的聚集地。北京市科学技术委员会、中关村科技园区管理委员会的数据显示,北京AI学者已经超过1.5万人,全国占比为30.6%,位居第一。

据统计,北京已有北京大学、清华大学、北京航空航天大学等30余所高校获批人工智能本科专业,有20余所高校设立了人工智能学院或研究院,32所高校拥有与人工智能直接相关学科的博士、硕士学位授权,在校研究生4.4万人,教师及科研人员1.2万人。

人才和资金支持无疑是当下AI发展的必要条件,而北京市在政府产业基金投入方面更是雷厉风行。

近两年,北京在AI产业的投资力度正持续增加。

2019年以来,北京海淀区、经济技术开发区、顺义区政府政府投资基金都不断扩容,包括北京海淀中关村科学城科技成长三期基金发布,基金总规模增至200亿元;北京经济技术开发区政府投资引导基金二期宣布将正式设立,总规模100亿元;北京顺义股权投资引导基金(有限合伙)正式发布,远期规模100亿元,首期10亿元……

此外,2024年,北京市一口气落地8支产业基金,资金规模为100亿元或200亿元,涵盖机器人、AI、先进制造和智能装备多个领域。

就在上个月,北京举行的《北京具身智能科技创新与产业培育行动计划(2025—2027年)》专场新闻发布会中就明确提到,北京已设立总规模1000亿元、存续期15年的政府投资基金,重点支持AI、机器人等未来产业领域。

目前国内几大一线城市的创投产业发展蓬勃,根据清科研究中心的数据,2024年募资规模北京、浙江、江苏位列前三,规模分别为1892.79亿元、1826.64亿元、1717.80亿元;全国投资金额规模第一为上海,达1101.45亿元,北京位居第二达1042.72亿元,第三是深圳金额为409.14亿元。这之中北京募资规模居全国首位,投资规模位列第二,是不折不扣的创投高地。

结语:打造AI超级生态,催生“DeepSeek”类企业涌现

从大模型产业爆发到DeepSeek这一AI界现象级公司诞生,全国城市在新兴产业的竞赛更加白热化。

对于AI产业而言,其发展具有很强的全局性,其技术研发涉及到数学、计算机科学、统计学、神经科学等多个学科领域,应用场景涵盖医疗、交通、金融、教育、制造业等几乎所有行业,再加上AI产业的上下游产业链长,从基础的算法研究、芯片制造,到中间的模型开发、数据标注,再到下游的应用产品开发和服务提供,各个环节都紧密相连。

因此,从政府层面,北京、杭州、上海、深圳等城市已经接连发布各项支持政策、加强资金投入、人才引进等措施,围绕着AI产业的算力集群、数据供给、场景应用等加速AI的发展和普及。

在此基础上,城市力量正依托于完备的AI发展生态体系,形成强大的成果转化能力,让更多的“DeepSeek”涌现出来成为可能。

0 阅读:0
智东西

智东西

智能产业第一媒体!聚焦智能变革,服务产业升级。