全球顶尖AI科学家许主洪加盟阿里巴巴,担任阿里集团副总裁负责AIToC业务|钛媒体AGI

钛媒体APP 2025-02-06 10:46:21

2025开年,行业领先的AI科学家加入阿里巴巴。

2月6日消息,钛媒体AGI获悉,全球顶尖人工智能科学家许主洪教授(StevenHoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AIToC业务的多模态基础模型及Agents相关基础研究与应用解决方案。

另有消息称,内部系统显示,许主洪目前的身份是管理层,base在新加坡,根据汇报线关系,他的职级应该是P10或者P11。

公开信息显示,许主洪在AI工业界和学术界拥有超20年经验,2002年清华大学本科毕业后,许主洪分别在2004年和2006年获得香港中文大学计算机科学与工程系的硕士学位和博士学位。

许主洪曾在新加坡南洋理工大学、新加坡管理大学担任教授,也曾担任全球最大企业CRM软件厂商Salesforce集团副总裁、亚洲研究院创始院长,目前是新加坡管理大学(SMU)信息系统学院的终身教职。他发表的300余篇AI顶级学术论文,引用量超过5万余次。其发表的多篇“多模态预训练”主题论文影响力很大,论文引用数位列当年全球前五,其提出的预训练策略有效降低成本,深刻影响了全球大模型研发。

2019年,许主洪当选代表全球科学与工程技术领域顶尖成就的IEEEFellow(电气和电子工程师协会会士),并被斯坦福大学评选为“全球前1%的人工智能科学家”。

2023年,许主洪创立AI初创公司HyperGAI,开发出先进的多模态端侧大语言模型,推出了前沿的图像和视频生成模型及产品,最新的用于边缘和移动设备的开源轻量级多模态模型HPT1.5Edge,其性能超越了微软Phi-3-Vision(4B)模型,并在多个基准测试中达到GPT-4V性能。目前暂不清楚HyperGAI是否已经被阿里收购。

针对近期DeepSeek热潮,许主洪发文表示,DeepSeek-R1非常热门,但LLM+RL(大语言模型+强化学习)框架的想法并不完全新颖。

“2022年,我的SalesforceAI团队是提出LLM+RL联合训练和推理框架的先驱之一,这比OpenAIO1和DeepSeek-R1的工作早了几年。我们发表了一篇名为CodeRL的NeurIPS论文,该论文在代码生成方面实现了开源SOTA,使用不到1B代码的LLM模型(击败了10倍大的模型)。我们的想法是应用与AlphaGo/AlphaZero类似的原理和方法,以自学的方式训练和改进LLM,但基础LLM模型的大小和性能不够强(ChatGPT尚未发布)。”许主洪称。

实际上,近期,阿里巴巴AIToC业务大动作频频,业务布局消息不断,引入世界级顶尖人才,组建顶级AI算法研究和工程团队。

目前,阿里巴巴“少壮派”高管吴嘉担任阿里巴巴智能信息事业群总裁,淘天用户平台事业部与阿里妈妈事业部负责人,兼任淘天集团淘宝直播及内容事业部负责人。同时,阿里旗下AI应用“通义”并入阿里智能信息事业群,天猫精灵团队与夸克产品团队融合工作,探索AI眼镜等新硬件方向。

许主洪的加入,大大提升阿里巴巴AI应用C端产品在模型结合应用的端对端闭环能力上的跃迁。同时,阿里AIToC业务正在组建顶级AI算法研究和工程团队,吸引大量业内优秀人才加盟。

钛媒体AGI了解到,目前已经有多位微软亚洲研究院的AI科学家正在与阿里接触,有望近日对外公布加入信息。

当前在DeepSeek和字节的猛攻下,阿里正在对AIToC加码人才与资源投入,而且正在全面整合阿里内部AI资源,对阿里AIToC在多模态Agents以及商业化等方向进行深入探索,也为下一阶段构建面向用户的AI应用平台打开了想象空间。

0 阅读:2