中国特色大模型“涌现”2023世界人工智能大会

7月6至8日，2023世界人工智能大会在上海举办。此次大会，可谓是中国人工智能产业的一次大阅兵，中国各大人工智能企业及机构发布的“大模型”成为此次大阅兵中最醒目的一支队伍。

中国大模型应用牵引

据介绍，此次大会上，华为“盘古”、商汤“日日新”、网易“伏羲”等30多款国产人工智能大模型集中亮相。

华为在此次展会上，设立了昇腾展区，并于7月7日正式发布了盘古大模型3.0。

据介绍，该模型主要是为解决当前人工智能开发者“小作坊”模式应用开发效率较低的问题。华为常务董事、华为云CEO张平安强调“盘古大模型“不作诗，只做事。”目前，基于华为昇腾AI算力，原生研发、适配的大模型已超过30个，占中国大模型近一半数量。华为的盘古大模型已经深耕金融等10多个行业，覆盖了400多个业务场景。

“商汤日日新”大模型体系也于大会期间宣布全面升级。

据介绍，“日日新”大模型体系下，自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制，推出不同参数量级的模型版本，可适配移动端、云端等不同终端及场景的应用需求，降低部署成本。

这其中，在医疗场景，商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”，提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力，未来将支持医学图像、文本、结构化数据等多模态综合分析。

在智能汽车的智能座舱方面，通过大模型的环境理解、逻辑思维和内容生成能力，形成“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD，商汤构建车路云协同的交通体系，推动车路云共同向大模型对话式交互演进。

阿里云“通义千问”也亮相了展会。

现任阿里云CEO张勇此前表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造，包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。张勇还表示，在阿里云构建的大模型基础设施平台上，将不仅有阿里的通义大模型，还能够接入各种高校、科研院所、企业机构的大模型，为更多专属模型的训练和服务提供保障。

综上所述，中国这些大模型，着眼于行业应用的探索，体现了应用牵引的中国特色。就如腾讯副总裁、腾讯政企业务总裁李强在此次大会上指南出的：通用大模型不是模型应用的唯一方向，面向垂直产业的模型会成为大模型价值的引爆点。随着技术不断迭代，大模型产业应用也将迎来加速，为数字经济和实体经济发展注入澎湃动力。

克服算力瓶颈中国方案创新

大模型的加速发展，上千亿数据参数的训练，最大的挑战就是算力。诚如华为轮值董事长胡厚崑在2023世界人工智能大会上作主题演讲时所指出的：在中国当前的情况下，算力在可获取性和成本方面，都面临着不小的挑战。因而，面对算力瓶颈，多家企业带来了它们的算力解决方案。

作为ICT产业巨头，华为坚持深耕算力，主要聚焦在鲲鹏和昇腾的根技术上，通过架构创新、发展生态，以及灵活共建等手段，支撑未来算力底座的打造。

在计算节点层面，推出革命性的对等平构架构，突破传统的以CPU为中心的异构计算带来的性能瓶颈，从而提升整个计算的带宽、降低时延，使得节点性能得到30%的提升；

在数据中心层面，在2019年推出了昇腾AI集群，发挥云、计算、存储、网络、能源的综合优势，相当于把AI数据中心当成一台超级计算机来设计，使得昇腾AI集群性能更高，并且更可靠。实测发现，通过集群的方式，在同等算力的情况下可以得到10%以上的效率提升。

腾讯云也在此次大会上公布了多项升级。

其中，最新升级的腾讯云自研星脉高性能计算网络，能提升40%的GPU利用率，节省30%~60%的模型训练成本，为AI大模型带来10倍通信性能提升。基于腾讯云新一代算力集群HCC，可支持10万卡的超大计算规模。

算力支撑的更底层则是AI算力芯片，在此次大会，AI算力芯片企业燧原科技展示了“云燧智算集群”。

这一面向大型智算中心的高性能人工智能加速集群，旨在满足AIGC时代对超大规模算力的需求。该集群被2023被评为世界人工智能大会展会评为九大镇馆之一。