据AI科技评论1月8日消息称,前微软亚洲研究院视觉计算组首席研究员胡瀚已加入腾讯,接替此前离职的腾讯混元大模型技术负责人之一刘威,负责多模态大模型研发工作。
据悉,胡瀚教育背景深厚,2008年获清华大学本科学位,2014年获该校博士学位,师从周杰教授,其博士论文获2016年中国人工智能学会优秀博士论文奖,还曾于2012年在宾夕法尼亚大学GRASP实验室访问研究,师从史建波教授。此后,胡瀚加入百度深度学习研究所担任techleader,2016年12月进入微软亚洲研究院视觉计算组,期间作为核心作者参与创作的《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》获2021年ICCV最佳论文奖,该论文推动了计算机视觉领域发展。
而此前从腾讯混元离职的刘威在2012年获哥伦比亚大学计算机科学与电子工程博士学位,在IBM沃森研究中心担任研究科学家,屡获学术殊荣,2016年加入腾讯AILab,与张潼、俞栋并称“AILab三剑客”,为腾讯在大规模机器学习和智能多媒体等领域做出诸多贡献,于2024年十一月下旬离开腾讯。
12月3日宣布混元大模型上线并开源文生视频能力,参数量130亿,支持中英文双语输入,此前已推出文生文、文生图、3D生成等能力,此次视频生成能力补齐混元系列重要拼图。此次,胡瀚的加入是否能助力腾讯在多模态大模型领域迈向新高度?