最近,国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。据证券时报报道,雷军亲自出手挖人了!据悉支付的薪酬,在千万元级别。
![](http://image.uc.cn/s/wemedia/s/upload/2024/82a09c0305df2be59b718baea3e34e77.png)
图源:雷军视频号
95后AI“天才少女”刷屏
雷军千万年薪挖角
AI大模型的风终于吹到了小米。
据证券时报报道,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。
![](http://image.uc.cn/s/wemedia/s/upload/2024/7bac1eeec57e6936bd1afd84cb4836c6.jpg)
图源:罗福莉个人公众号
公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”
![](http://image.uc.cn/s/wemedia/s/upload/2024/c584fa5925f06183558e06afedcc9701.png)
硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
![](http://image.uc.cn/s/wemedia/s/upload/2024/660581b107d718aea5d60a92f5b2cae0.jpg)
图源:罗福莉个人公众号
今年5月,在DeepSeek-V2发布以后,罗福莉在知乎上撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。
12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。
小米大动作
被曝搭建GPU万卡集群
事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一个动作。
今年11月,小米成立了专门的AI平台部,小米的元老级技术大牛张铎为负责人。张铎本硕毕业于清华计算机系,曾被雷军公开称赞是“小米的大神”,送以“铎神”的称号。
![](http://image.uc.cn/s/wemedia/s/upload/2024/37559901bd779ff2d196e3224942a8b0.png)
在小米招聘的官方页搜索就可以发现,仅北京地区大模型相关岗位就多达59个职位
加大AI与算力投入
研发费用五年超千亿
除了招募人才以外,近期小米正在搭建GPU万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划已施行数月,由集团董事长雷军亲自领导。对此,21世纪经济报道记者联系小米相关人士求证,对方未予回复。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。
他预计,自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
在AI团队建设方面,小米自2016年组建AI团队以来,经过多次扩展,相关领域人员规模已达3000多人。
对雷军千万年薪挖掘AI人才
你怎么看?欢迎评论说说
来源:21世纪经济报道、证券时报、@小米汽车