看过HDC2024，真是感觉B端大模型思路不一样

2024年的大模型赛事已过半程。

看过科技企业前半程的表现，尤其是压轴上场的华为开发者大会2024（HDC 2024），越发确认C端大模型和B端大模型的思路真是不一样。C端大模型在“卷Token长度”、“卷价格”，其背后潜在目的是为了“卷数据”。他们希望以Token长度和价格，卷来更多的数据，加速提升大模型的成熟度，进而增加生态黏性。

B端大模型的思路完全不一样。

HDC 2024期间，华为云盘古大模型5.0正式发布。发布过程中，华为云用了一半时间讲创新技术，另一半时间讲大模型的行业落地。而且华为云从下到上所有细节都没一笔带过，从AI基础设施，到多模态大模型，再到行业大模型，以及具身智能，每一个环节的想法，华为云也都交代得清清楚楚。

01 大模型到底在卷啥？

其实，在“百模大战”最热闹的时候，也少有人提出“大模型泡沫”的质疑。或者说，在这场关乎未来生产力的全球竞争中，现在多少卷些也无所谓。只不过进入2024年，大模型的竞争焦点开始分化。

“百模大战”早期，科技企业是在卷参数量，千亿参数和万亿参数大模型层出不穷。随后，部分大模型又开始“卷Token长度”、“卷Token价格”，但这些都是典型C端大模型的思维。

B端大模型当然也缺数据，尤其是缺高质量的中文数据。好在，中国并不缺应用场景。两会期间提出“人工智能+”行动计划，并号召央企带头抢抓人工智能赋能传统产业，率先将应用场景开放出来。

这就释放了相当积极的信号。

只不过，挑战依然存在。企业中的文本、音频、图片、视频等数据，散落在不同角落；企业中的数据还要经专家级的标注，才能成为高质量的训练语料；企业用户对大模型的识别准确度，更提出了更高的入职标准。

或者说：“工作向左，生活向右”。从文理分班的那一刻起，企业用户对B端大模型的能力结构，就提出了不一样的需求。

02 不挑食，才能理解物理世界

华为云在此真下了不少功夫。

去年的这个时候，华为云盘古大模型3.0发布，它包括5+N+X三层架构，是一个完全面向行业的大模型系列；今年HDC 2024期间，华为云盘古大模型5.0正式发布，它在多模态、全系列、强思维等方面进行了全新升级。

其中，“多模态”能力尤其受到关注。原因很简单，物理世界就是多种模态的，大模型要走进千行万业，大模型要看懂物理世界中的应用场景，就需要更多地理解及整合多模态的行业数据。

此方面的华为云盘古大模型5.0，主打的就是一个不挑食，营养均衡。它能够更好地理解物理世界，更精准地识别和理解文本、图片、视频等数据，甚至是雷达、红外、遥感等更多的模态数据。

上述能力应用在图片和视频识别方面，盘古大模型5.0就能够准确分析出卫星遥感图像中的农作物生长情况，这可用于产量预估、病虫害监测等领域；它还能够通过红外影像，精准的识别夜间车辆的位置，这也将提升交通违停的管理效率。

同时，盘古大模型5.0的多模态生成能力，跟Sora关注点也不一样。它聚焦于行业急需的应用场景。例如，在自动驾驶领域，它就通过创新的STCG技术，大规模地生成和实际场景相一致的驾驶视频数据。甚至，它还可以用模型生成晴天、雨天、黑夜的行车视频。

03 B端大模型的“着陆点”

另一维度，关注“多模态”数据之外，B端大模型也更关注“落地点”。2023年，科技企业都在研究“大材小用”——将大模型落地于小场景。但之后他们发现，“小材小用”或“量才适用”才是更好的思路。

本次HDC 2024，华为云盘古大模型5.0就推出了不同参数规格的模型，以适配不同的业务场景，例如，十亿级参数的Pangu E系列，可支撑手机、PC等端侧的智能应用，属于典型的“小钢炮”式大模型。

百亿级参数的Pangu P系列，则适用于低时延、高效率的推理场景；千亿级参数的Pangu U系列适用于处理复杂任务；万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。

毫无疑问，上述四个系列的大模型，都是典型B端大模型的思维。它们可落地在智能终端、智慧工厂、企业大脑、城市IOC等场景，也可以担任办公助理、质检员、网格管理员等职业角色。

04 B端大模型的制高点

当然，B端大模型的制高点在行业大模型，制高点上的明珠更是企业大模型。这也正如华为常务董事、华为云CEO张平安所说：“华为云盘古大模型是为解决行业难题而生。”

过去的一年，华为云盘古大模型已在30多个行业、400多个场景中落地，已在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥着巨大价值。

例如从去年关注货运的铁路大模型，到今年推出关注客运的高铁大模型，就说明盘古大模型的能力又有精进。其中搭载了“盘古眼”的巡检机器人，可精准识别一列动车的3.2万个项点，覆盖8大类、350+种复杂故障，故障识别准确率可达99%。

另一需要关注的是钢铁大模型。

宝钢股份正在推动盘古大模型在热轧、高炉等场景落地。实践表明，在大模型的调节下，每减少10℃的温度波动，每吨铁水就可以减少1kg焦炭消耗，成本降低3块钱。如此一来，预计每年可以为宝钢股份降本超过10亿元。

05 B端大模型知行合一

除此之外，B端大模型的另一思维特点是讲究“知行合一”。复杂逻辑推理是大模型成为行业助手的关键，华为云则将思维链技术与策略搜索深度结合，极大提升了数学能力、复杂任务规划能力，以及工具调用能力。

很明显，华为云已经在关注AI应用的更高阶段。过去三年，AI应用多停留在感知智能、互动智能、理解智能阶段，典型的应用包括人脸识别、智能客服、智能营销、办公助手、营销助手等。

此次，华为云升级大模型的多模态能力，以及强思维、复杂逻辑推理能力，其实已经是瞄准了AI Agent智能体和具身智能，这是AI应用的更高阶段。或可如此比喻，如果大模型是“大脑”，智能体就是“手脚”，具身智能则代表AI应用的“知行合一”。

HDC 2024期间，华为云就展示了诸多具身智能应用。盘古大模型能够让机器人完成10步以上的复杂任务规划，并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频，让机器人更快地学习各种复杂场景。

更重要的是，华为云还有杀手锏。HDC 2024期间，华为正式发布HarmonyOS NEXT版，“盘古”和“鸿蒙”也首次联袂亮相。而且不同于ChatGPT与苹果iOS的集成，“盘古”与“鸿蒙”之间，智能时代的操作系统与万物智联的操作系统之间，实现了深度集成。

这其中典型的应用，就包括云助小艺，以及云手机等。而且类似的应用，已更多地出现在行业端。据华为云合作伙伴介绍：如此的深度集成，系统调用AI能力将更为流畅，用户的数据安全也将得到保障，这都是企业用户关注的核心。

06 AI全栈能力创新

B端大模型的最后一个典型思维是，关注从AI基础设施、AI算力，到AI开发平台、AI大模型的全栈服务。

HDC 2024期间，华为云透露了一组数据：

业界万亿参数模型训练无中断时长是2.8天，华为云昇腾AI云服务可以做到40天无中断；业界集群故障恢复的平均时间约60分钟，昇腾AI云服务可以缩短到10分钟。同时，昇腾AI云服务还能将大模型的资源开通时间从月级缩短到天级。

不仅如此。当前云平台在大模型的训练和使用过程中，一直存在“算力墙”、“内存墙”、“能效墙”等问题。对此，华为云CTO张宇昕说：“为了解决这个难题，打造了下一代的云基础设施CloudMatrix，改变了传统数据中心的架构和算力供给模式。”

这一基础设施，将传统的以CPU为中心的主从架构，演进为多元算力对等全互联架构；并通过高速互联网络协议，将CPU、NPU、GPU等算力资源全部互联和池化，从而把AI算力从单体算力演进到矩阵算力，开启智能算力新纪元。

同时，针对云平台在大模型的训练和使用中存在的“内存墙”问题，华为云首创EMS弹性内存存储，基于Memory Pooling专利技术，通过显存扩展、算力卸载、以存代算等三大手段来打破内存墙。

07 解行业难题、做行业难事

由此可见，华为云就代表了典型B端大模型的思维。此思维是“不挑食”，努力理解物理世界；是关注垂类模型，寻找更多业务“着陆点”；是抢占行业大模型的业务“制高点”；也是讲究“执行合一”；更是关注从AI基础设施、AI算力，到AI开发平台、AI大模型的全栈技术创新。

正是在五个方面持续投入，华为云才能年年在开发者大会上拿出新东西，给开发者、企业使用；遵循此五个方面的业务路线和技术路线，华为云也才敢说：“盘古将继续坚定在行业里解难题、做难事。”