7月6至8日,2023世界人工智能大会在上海举办。此次大会,可谓是中国人工智能产业的一次大阅兵,中国各大人工智能企业及机构发布的“大模型”成为此次大阅兵中最醒目的一支队伍。
中国大模型 应用牵引
据介绍,此次大会上,华为“盘古”、商汤“日日新”、网易“伏羲”等30多款国产人工智能大模型集中亮相。
华为在此次展会上,设立了昇腾展区,并于7月7日正式发布了盘古大模型3.0。
据介绍,该模型主要是为解决当前人工智能开发者“小作坊”模式应用开发效率较低的问题。华为常务董事、华为云CEO张平安强调“盘古大模型“不作诗,只做事。”目前,基于华为昇腾AI算力,原生研发、适配的大模型已超过30个,占中国大模型近一半数量。华为的盘古大模型已经深耕金融等10多个行业,覆盖了400多个业务场景。
“商汤日日新”大模型体系也于大会期间宣布全面升级。
据介绍,“日日新”大模型体系下,自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求,降低部署成本。
这其中,在医疗场景,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。
在智能汽车的智能座舱方面,通过大模型的环境理解、逻辑思维和内容生成能力,形成“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD,商汤构建车路云协同的交通体系,推动车路云共同向大模型对话式交互演进。
阿里云“通义千问”也亮相了展会。
现任阿里云CEO张勇此前表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。张勇还表示,在阿里云构建的大模型基础设施平台上,将不仅有阿里的通义大模型,还能够接入各种高校、科研院所、企业机构的大模型,为更多专属模型的训练和服务提供保障。
综上所述,中国这些大模型,着眼于行业应用的探索,体现了应用牵引的中国特色。就如腾讯副总裁、腾讯政企业务总裁李强在此次大会上指南出的:通用大模型不是模型应用的唯一方向,面向垂直产业的模型会成为大模型价值的引爆点。随着技术不断迭代,大模型产业应用也将迎来加速,为数字经济和实体经济发展注入澎湃动力。
克服算力瓶颈 中国方案创新
大模型的加速发展,上千亿数据参数的训练,最大的挑战就是算力。诚如华为轮值董事长胡厚崑在2023世界人工智能大会上作主题演讲时所指出的:在中国当前的情况下,算力在可获取性和成本方面,都面临着不小的挑战。因而,面对算力瓶颈,多家企业带来了它们的算力解决方案。作为ICT产业巨头,华为坚持深耕算力,主要聚焦在鲲鹏和昇腾的根技术上,通过架构创新、发展生态,以及灵活共建等手段,支撑未来算力底座的打造。
在计算节点层面,推出革命性的对等平构架构,突破传统的以CPU为中心的异构计算带来的性能瓶颈,从而提升整个计算的带宽、降低时延,使得节点性能得到30%的提升;
在数据中心层面,在2019年推出了昇腾AI集群,发挥云、计算、存储、网络、能源的综合优势,相当于把AI数据中心当成一台超级计算机来设计,使得昇腾AI集群性能更高,并且更可靠。实测发现,通过集群的方式,在同等算力的情况下可以得到10%以上的效率提升。
腾讯云也在此次大会上公布了多项升级。
其中,最新升级的腾讯云自研星脉高性能计算网络,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升。基于腾讯云新一代算力集群HCC,可支持10万卡的超大计算规模。
算力支撑的更底层则是AI算力芯片,在此次大会,AI算力芯片企业燧原科技展示了“云燧智算集群”。
这一面向大型智算中心的高性能人工智能加速集群,旨在满足AIGC时代对超大规模算力的需求。该集群被2023被评为世界人工智能大会展会评为九大镇馆之一。