作者 | 常棣
编辑 | 葛覃
“未来已来,只是尚未流行。”愈是近距离感受到云计算行业的焦虑与变革,就愈能让人联想到威廉·吉布森在《爆裂》中写下的这句话。
云计算正在被大模型重塑,两者的关系类似于电力和电动机,云厂商所扮演的角色,就是智能时代的电厂。而如果再细细研究,就会发现一个有意思的事实——直流发电机比交流发电机的出现早了50年,但后者才真正让世界全面进入电气化时代。
这也是当下云计算领域正在发生的新故事,但是,如何让云计算完成从直流电到交流电一般的转变,整个行业都在关注。
法拉第走了和爱迪生完全不同的道路,最终有了交流电的胜利,计算机、互联网甚至人工智能等技术和产业,都建立在电力的基础之上,没人再关注电力本身。
华为云也走出了一条更难走的道路,随着华为云华东(芜湖)数据中心正式开服,标志着华为云全国存算网的枢纽节点布局全面完成,企业可通过全球存算网和昇腾AI云服务,推动“百模千态”的应用创新。
云计算真正进入下一个时代自AWS 在 2006 年公开发布 S3 存储服务,云计算行业已经走过了十多个年头,伴随着争议与探索,时至今日,仍有一些观点在质疑云计算,核心原因是很多场景并不是非云计算不可。
根据技术代差递补性(Technical Generation Complementary)理论,当一项具有代差的全新技术出现时,由于它自身的不完备性,往往需要现有技术作为其补充,与之形成在技术上的“高低搭配”,因此新技术并不能够完全取代现有技术而主宰整个市场。
比如,固定电话的出现并没有立刻导致电报的出局,但移动电话的出现却直接将电报三振出局;再如五代战机与四代战机形成高低搭配,淘汰三代机等。
云计算行业的历史尚短,还不足以形成技术代差,但是大模型却成为了新的代差技术,与云计算形成了高低搭配,从而淘汰云计算之前的传统IT。
典型如大模型的推理和训练场景都需要大算力:大模型训练通常需要数千张GPU卡,基于TB级别的数据,耗时几个月进行训练,然后其他用户在预训练大模型的基础上再进行强化学习,而这需要数百张GPU卡,耗时一两个月。
同时,AI算力对数据中心要求极高。由于AI服务器的功率密度远超通用服务器,单机柜的功耗是过去的6-8倍,并需要专用的液冷系统进行散热,才能降低PUE(能效比)。且大模型训练动辄需要千卡乃至万卡,服务器之间的互联、时延、可靠性、运维极为挑战。
然而,自建数据中心周期长、要求严苛、能耗高,难以满足大模型时代快速训练和迭代的要求;同时由于各地政府的“绿色数据中心”政策限制,IDC新建/扩容严格受限。相比之下,云计算具有即开即用、按需使用、灵活部署、集群算力、专业服务、运维&安全等优势,成为大模型训练、推理部署的必要基础设施。数据显示,AI算力已重度依赖云化部署,2025年算力云化比例达到高峰80%。
与此同时,随着大模型创新,多模态融合,模型参数将从现在的数千亿攀升至数万亿,对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求,只有云化算力才能满足大模型的要求.
昇腾AI云服务,给世界第二种选择如果说此前企业自建数据中心还情有可原,在较大的自用规模下能保证一定的性价比,华为云芜湖数据中心就证明了,智能时代,企业再去自建数据中心,不仅没有性价比,而且很可能错过技术更新,从而落后于行业。
华为云芜湖数据中心规划占地约6000亩,规划了300万台服务器,秉承华为云在节能、AI集群、液冷机房的丰富经验,芜湖数据中心构筑了绿色低碳、安全可靠等技术优势。
以算力层面的优化为例,为满足超大规模算力需求,芜湖数据中心首次采用了华为云全新研发的多元算力对等池化架构:通过分布式擎天架构实现CPU、NPU、GPU、内存等多样资源统一抽象、池化,从单体算力架构演进到矩阵算力架构,使算力提升50倍。
此外,华为云通过超高带宽的Scale Up网络,将资源对等连接起来,打破了单体算力性能和集群线性度瓶颈,可有效提升了大模型的训练效率;通过瑶光智慧云脑可将多种池化资源统一调度管理,实现灵活按需组合,提供百亿到万亿参数模型的最优算力配比。
华为公司副董事长、轮值董事长徐直军就表示,华为云华东(芜湖)数据中心是华为云版图的重要组成部分,能帮助企业使用云上算力,随取随用,技术永新。企业则不必建设数据中心,可以聚焦在自身业务发展上。
在国外算力受到封锁供给短期,难以跟上国内算力需求节奏的大背景下,国产大模型的创新发展,需要国产化AI算力支撑,而云化算力是最大化算力价值、最大程度降低算力门槛的选择。
根据Scaling Law原理,随着模型规模的增加,包括参数数量、数据规模和计算资源,模型的性能也会相应提高,这也是为何单体数据中心的规模越做越大,企业需要的单一算力集群规模也越来越大。
因此,具备更大规模效应的公共算力中心,才是解决算力紧缺问题的最佳方案,“算力的尽头是上云”,昇腾AI云服务可以说是企业在智能时代所需云算力的最佳方案。
华为云,做“云”的底座纵观全球,不论是AWS、微软等海外云厂商,还是国内云巨头,都希望用大模型带动云服务收入,其中英伟达的芯片必不可少,海外云厂商需要英伟达构建提供AI算力的云,国内云厂商先天受限。
华为云,不止推出了自己的昇腾AI云服务,更进一步,以昇腾为抓手成为新时代“云”的底座。
算力竞逐背后,是人工智能时代话语权之争。正如科大讯飞董事长刘庆峰所言,“中国的产业界非常自豪,华为能够在真正的硬科技算力层面上给世界第二种选择。我们特别需要在国产上更大规模的算力支撑,现在业界能够量产做大模型训练除了英伟达只有华为一家,在推理上已经做到完全对标英伟达。”
华为的定位一以贯之,始终做智能世界的黑土地,当时代背景发生了变化,华为云也随之调整身位,如果仅仅做云满足不了国内千行万业的需求,那么华为云就再做深一层,成为云厂商背后的创新力量。
如此,华为云既有算力基础设施,又掌握底层根技术科技,站在智能时代的云厂商的背后,做云底座的“底座”,繁荣更大的产业生态。
更值得关注的是,华为云的全栈AI能力,包括芯片、数据中心、大模型、训练和推理框架、AI 开发生产线、AI应用生态等一系列能力,都可以成为云厂商和众多企业的创新源泉。
华为云通过全栈AI能力,将云计算降维成AI的基础和基本,华为云的全栈AI能力已经帮所有企业构建好了技术底座,不论是云厂商还是各类企业,都可以利用华为云不同能力的组合,去打磨自己的生产力。
正如历史上蒸汽机、交流电、互联网刚刚诞生时,人们对这些新出现事物的前景表现出的“迷茫”那样,我们对人工智能的想象力并没有好到哪里。只有一个事实是确定的,一切还在混沌中,各种技术的集聚行将爆发但未完全爆发。
于是,华为云将人工智能所有的必须要素准备妥当,做产业技术和生态背后的根力量,助力所有企业博得大时代的新机会。
云计算的未来已经清晰可见,华为云改变了云计算,构筑了面向未来的全栈AI能力,通过全球存算网、昇腾AI云服务、盘古大模型等创新技术,让企业不必再关注云计算本身,以更轻盈的姿势迎接将要到来的智能时代。