雷军,作为小米科技的掌舵人,在用人方面一直有着独到的眼光。过往,为了打造小米的 “梦之队”,他不惜花费大量精力与时间,四处寻觅顶尖人才。还记得当年为了组建硬件团队,面对诸多困难与挑战,雷军和其他创始人轮番上阵,与候选人一聊就是近 10 小时,只为找到那个最合适的人。从摩托罗拉挖来钱晨,助力手机硬件研发;说服谷歌全球副总裁 Hugo Barra 加盟,让小米国际业务得以飞速拓展。这些成功的 “挖角” 案例,无不彰显出雷军识人的精准与用人的魄力。
如今,AI 领域成为各大科技巨头必争之地,雷军怎会错过这一风口?他再次出手,而这次的目标,是有着 “95 后 AI 天才” 之称的罗福莉。当大家听闻雷军亲自下场挖人,且一出手就是千万级薪酬时,整个科技圈都沸腾了。这位罗福莉究竟是何方神圣,能让雷军如此看重?
罗福莉,这位出生于四川小城普通家庭的 95 后女孩,在上大学之前,几乎未曾接触过计算机领域。命运的齿轮悄然转动,她误打误撞进入北京师范大学计算机专业。刚入学时,由于基础薄弱,成绩一度垫底,然而,她骨子里那股不服输的劲儿被彻底激发了出来。凭借着过人的天赋与不懈的努力,她的成绩如同坐火箭般飞速提升,成功跃居前列,并顺利保研至北京大学计算语言学研究所。
2019 年,对于罗福莉来说,是具有里程碑意义的一年。还在北大读硕士的她,在人工智能领域顶级国际会议 ACL 上发表了 8 篇论文,其中 2 篇为第一作者。这一惊人的成绩瞬间在学术界掀起波澜,她提出的词义消歧方法和文本风格转换框架等成果,极大地推动了 NLP 技术的发展,也让她一举登上知乎热搜,成为众人瞩目的 “AI 新星”。当被问及这一辉煌成就时,罗福莉在知乎上谦逊回应:“这次投稿 ACL 是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能有运气成分加持。” 但了解科研艰辛的人都知道,这背后是无数个日夜的钻研与付出,能在国际顶级会议上发表如此数量的高质量论文,实力毋庸置疑。
硕士毕业后,罗福莉手握各大厂的顶级 offer,却毅然选择进入阿里达摩院,投身工业界。在达摩院,她主导开发了多语言预训练模型 VECO,该模型被纳入阿里达摩院深度语言模型体系 AliceMind,她还挑起了 AliceMind 开源工作的大梁。这一模型在实际业务中表现卓越,在阿里内部数十个核心业务落地,日均调用 50 亿次,活跃场景超过 200 个,像天猫精灵智能音响等产品都得益于该技术。罗福莉自己也感慨,进入工业界后,思考的重点从单纯追求模型的复杂庞大,转变为注重架构在不同业务场景下的通用性。
2022 年,罗福莉加入幻方量化,从事深度学习相关策略建模和算法研究,进一步拓宽了自己在 AI 领域的技术边界。随后,她跳槽至 DeepSeek,担任深度学习研究员,参与研发 MoE 大模型 DeepSeek-V2。今年 5 月,DeepSeek-V2 发布后,罗福莉在知乎上分享自己的见解,直言:“单论 DeepSeek-V2 模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加 1 元 / 百万输入 Tokens 的价格,只有 GPT4 价格的 1/100,性价比之王”。 从学术到工业界,罗福莉的每一步都走得坚实有力,成为 AI 领域不可多得的复合型人才。
早在 2016 年,雷军就前瞻性地察觉到 AI 的巨大潜力,毅然决然地组建了 AI 团队,开启了这场漫长而艰辛的探索之旅。最初的视觉 AI 团队,点燃了小米 AI 发展的燎原之势。随后的数年里,小米 AI 如同一棵茁壮成长的大树,不断开枝散叶,历经 6 次关键扩展,将技术触手伸向视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态等多个前沿领域,构建起全方位的 AI 技术能力体系。
依托自身强大的硬件生态优势,小米将 AI 技术巧妙地融入手机、汽车、AIoT、机器人等核心业务板块。就拿小爱同学来说,自 2017 年诞生以来,它在与用户长达 6 年的朝夕相伴中,积累了海量的交互经验,实现了多场景智能融合。从最初只能执行简单的语音指令,到如今能够精准洞察用户复杂意图,提供个性化贴心服务,小爱同学已然成为小米 AI 技术落地的典范之作,见证着小米 AI 的成长与蜕变。
2023 年 4 月,小米 AI 发展迎来又一座里程碑 ——AI 实验室大模型团队正式组建。任命栾剑担任负责人,他曾在东芝(中国)研究院、微软(中国)工程院等前沿阵地深耕,积累深厚技术沉淀,如今肩负重任,向小米技术委员会副主席、AI 实验室主任王斌汇报,搭建起专业高效的攻坚架构。当时,团队成立便手握 6500 张 GPU 资源,为技术研发备足马力。雷军更是多次公开表态,小米在 AI 领域耕耘多年,面对大模型浪潮,必将全力以赴。这一决心贯穿于团队组建、技术研发、产品落地的全过程,推动小米 AI 大模型加速前行。如今,这个团队已悄然壮大至 1200 余人,仅北京地区就开放了 59 个大模型相关职位,一场关于 AI 的科技盛宴正在小米内部悄然上演。
在 AI 这场激烈的科技竞赛中,硬件实力犹如赛道的基石,至关重要。小米显然深谙此道,在 GPU 算力资源上持续加码,为 AI 大模型研发提供强大动力。据知情人士透露,小米目前已拥有 6500 张 GPU 的算力资源,并且正在紧锣密鼓地搭建万卡级 GPU 集群,该计划已稳步推进数月,雷军更是亲力亲为,足见其对 AI 领域的坚定决心。
GPU 万卡集群究竟为何成为 AI 大模型研发的关键利器?从技术原理上讲,大模型训练如同搭建摩天大厦,需要海量数据作为基石,以及复杂的神经网络架构作为框架。而每一次模型训练中的参数调整、梯度计算,都涉及天文数字般的运算量。传统 CPU 在面对如此庞杂的并行计算任务时,往往力不从心。GPU 则不同,它专为并行计算而生,就像是一支训练有素的施工大军,能同时处理成千上万的微小任务。小米搭建的 GPU 万卡集群,意味着数以万计的计算核心协同发力,将极大加速模型训练进程。例如,原本需要数月才能完成的一次大模型迭代训练,在万卡集群的加持下,可能缩短至数周甚至数天,让小米在 AI 技术迭代的赛道上一路飞驰。
审视当下科技版图,众多厂商都在角逐 AI 大模型高地,GPU 集群建设也是各有千秋。与部分竞品相比,小米的独特优势在于其深厚的生态根基。一方面,小米拥有海量的终端设备。从智能手机、智能家居到智能汽车,数以亿计的设备每天产生浩如烟海的数据。这些来自真实使用场景的数据,回流至 GPU 万卡集群,为模型训练提供了无比丰富、多元且贴近生活的素材,让小米 AI 大模型能够 “接地气” 地成长,精准洞察用户需求。另一方面,基于自身生态,小米能将训练好的 AI 大模型迅速落地应用。以智能语音助手为例,借助集群训练优化后的模型,小爱同学能够更智能地理解方言、处理复杂指令,在小米手机、音箱等多设备间实现无缝协同,这种从研发到应用的高效闭环,是其他一些缺乏硬件生态支撑的厂商难以企及的,为小米在 AI 竞争中构筑起坚实壁垒。
当下,AI 大模型已然成为科技领域的核心驱动力,能够为智能产品赋予更为强大的智能交互、内容生成等能力。小米虽在 AI 领域早有布局,但其深知,要想在竞争白热化的赛道中脱颖而出,顶尖人才是关键一环。
罗福莉在大模型技术研发方面的深厚造诣,恰是小米所急需的。她曾主导开发的多语言预训练模型 VECO,展现出卓越的跨语言处理能力;参与研发的 DeepSeek-V2 模型,不仅中文水平位居前列,更是以超低的成本打破行业价格壁垒。这与小米一直秉持的 “性价比” 理念不谋而合。对于正全力攻坚 AI 大模型轻量化和本地部署的小米而言,罗福莉的经验如同璀璨星辰,照亮前行的道路。她的加入,有望助力小米在端侧 AI 推理上取得更大突破,既能贴近用户数据实现高效训练,又能大幅削减云端算力开支,让小米的 AI 产品在成本与性能之间找到完美平衡,以更强大的姿态角逐市场。
从罗福莉的角度来看,小米所提供的舞台无疑极具吸引力。小米构建的 “人车家” 全生态体系,拥有超 8.61 亿的 IoT 设备连接数,为 AI 大模型技术落地提供了无比丰富且多元的应用场景。想象一下,她所研发的大模型技术,能够让小爱同学在手机、音箱、汽车等多终端实现无缝智能交互,为用户带来前所未有的便捷体验;又或是赋能智能家居系统,使其能够精准洞察用户习惯,自动调节家居设备,营造舒适生活环境。这种从理论研究到大规模实际应用的快速转化,对于任何一位技术研发者来说,都充满了诱惑。
再者,小米在研发资源上的大力投入,也为罗福莉施展拳脚提供坚实保障。如今,小米 AI 实验室大模型团队已超 1200 人,北京地区就有 59 个相关职位虚位以待,加上正在紧锣密鼓搭建的万卡级 GPU 集群,如此雄厚的 “兵力” 与 “粮草”,意味着罗福莉能够调动更多资源,朝着 AI 技术的高峰奋勇攀登。
当然,接手小米 AI 大模型团队的领导重任,罗福莉需迅速适应新环境,整合团队力量,协调各方资源。在技术研发上,要应对不同业务板块对 AI 大模型的差异化需求,从复杂的手机端 AI 应用,到关乎安全的汽车智能驾驶辅助,再到智能家居的个性化场景搭建,每一个领域都不容有失。同时,在商业竞争层面,面对同行的激烈角逐,如何保持技术领先,让小米的 AI 大模型成为行业标杆,也是摆在她面前的一道难题。但以罗福莉过往的 “逆袭” 经历来看,她从不畏惧挑战,反而善于在困境中寻得突破之机,此次加盟小米,相信她也将砥砺奋进,书写属于自己与小米的 AI 新篇章。