雷军亲自挖人!为95后AI“天才少女”开出千万年薪

小星视看社会 2024-12-31 16:48:54

最近的科技圈,被一则重磅消息点燃:小米创始人雷军以千万年薪,挖来了AI界的”天才少女”罗福莉。

“你要不要来带领我们的AI大模型团队?”这个电话里,雷军的声音带着少有的兴奋。电话那头的罗福莉,正在为DeepSeek-V3的调试工作忙得不可开交。

这通电话的背后,是一个精心策划的“挖角计划”。就在不久前,DeepSeek推出的大模型DeepSeek-V3横空出世。这款被称为“AI界拼多多”的产品,以不到600万美元的成本,创造了堪比GPT-4的性能,轰动了整个AI圈。

“太不可思议了!”前OpenAI联合创始人Karpathy在社交平台上感叹,“他们只用了280万GPU小时,就达到了顶级水平。相比之下,Meta的Llama-3要耗费3080万GPU小时。”

而罗福莉,正是DeepSeek核心团队的关键人物。这个名字,在AI圈早已不是秘密。但鲜为人知的是,这位95后的”天才少女”,曾经也是个对计算机一窍不通的“小白”。

“我记得第一次看到代码的样子,”罗福莉在一次分享会上回忆,“就像看天书一样,满屏幕的字符让我头晕目眩。”那是在北师大读大一的时候,这个来自四川的姑娘,面对陌生的编程世界,几乎到了崩溃的边缘。

大学初期,她的计算机课程成绩一度垫底。“那段日子特别难熬,“她的大学室友小张回忆,”每天晚上都能看到她的台灯亮到深夜,有时候清晨起来,发现她趴在桌上睡着了,键盘上还停留在写了一半的代码。”

但罗福莉骨子里有股韧劲。“既然选择了这条路,就一定要走到底。“她给自己定下了严格的计划:每天早上六点起床,复习前一天的课程;晚上图书馆关门后,回宿舍继续肝代码到深夜。

功夫不负有心人。通过疯狂的自学和刻苦训练,她不仅追上了同学的进度,还开始展现出惊人的天赋。在第二学期结束时,她的编程课成绩已经跃居班级前列。

转机出现在大三那年。一次偶然的机会,她接触到了自然语言处理领域。“那一刻我感觉找到了自己的方向,”她说,“计算机不仅仅是冰冷的代码,它还能够理解和处理人类的语言,这太神奇了。”

凭借出色的表现,罗福莉成功保研北大计算语言学研究所。在这里,她迎来了人生的高光时刻:2019年,在人工智能顶级会议ACL上一口气发表8篇论文,其中2篇是第一作者。

“那段时间我几乎住在实验室,”她的同学回忆,“每天早上来都能看到她在电脑前敲代码,晚上走的时候她还在调试模型。有次实验室停电,她就搬了个小板凳坐在走廊的应急灯下继续看论文。”

毕业后,罗福莉先后辗转于阿里达摩院、幻方量化。在阿里期间,她主导开发的多语言预训练模型VECO,成为了业界标杆。来到DeepSeek后,她参与研发的DeepSeek-V2更是因超高性价比震惊业界。

“我们的模型性能达到国际一流水平,价格却只有GPT4的百分之一,”谈到自己的作品时,罗福莉眼里闪烁着自豪的光芒,“这才是真正的技术民主化。”

正是这种追求极致性价比的精神,打动了雷军。作为“性价比之王”的缔造者,他在罗福莉身上看到了小米的影子。

小米在AI领域的布局可谓雄心勃勃。从组建1200人的技术团队,到筹建万卡级GPU集群;从储备8.61亿IoT设备连接,到规划“人车家”生态布局。小米的AI版图正在悄然成型。

“小米做大模型的路子很特别,”雷军在内部会议上说,“我们要把AI带到每个人的生活中,让尖端技术不再高不可攀。”这与罗福莉的理念不谋而合。

如今,这位曾经的计算机“小白”,已经站在了AI浪潮的浪尖。从教室到实验室,从写不出代码到开发顶级模型,她用自己的经历证明:天赋固然重要,但更重要的是那颗永不言弃的心。

“我不觉得自己有多天才,”面对媒体采访,罗福莉说,“成功的背后是无数个挑灯夜战的时刻,是一行行代码的积累,是对技术的执着追求。”

站在2024年的年尾,AI技术正在重塑世界。但技术的进步从来不是冰冷的数据堆砌,而是无数像罗福莉这样的追梦人,用热血和汗水浇灌出来的。

这个世界会被AI改变成什么样?没人说得清。但有一点是确定的:在这场波澜壮阔的科技革命中,中国正在贡献着自己的力量,而这其中,有一个95后姑娘的倩影。



0 阅读:0
小星视看社会

小星视看社会

感谢大家的关注