文/黄海峰的通信生活
当下,大模型火热,数智化加速到来。
据工信部数据显示,中国初步构建了较为全面的智能产业体系,相关企业超过4500家,核心产业规模已接近6000亿元。
随着数智化持续发展,数字基础设施加速升级换代,使得政府、电信、交通、教育等各行业企业ICT运维运营复杂度与日俱增。
传统运维模式仿佛一艘老旧的帆船,在新时代波涛汹涌中,显得愈发力不从心。
此时,人们将目光投向智能、大模型等技术,希望借助新技术,让ICT基础设施能够稳定运转。
那么,ICT运维运营面临怎样的挑战?作为全球领先的ICT解决方案供应商的华为,如何为运维行业赋予智能能力?
在全球盛会华为全联接大会期间的“ICT运维运营,为行业数智化转型保驾护航”分论坛上,笔者看到了面向台下近200位全球各国各行业嘉宾,华为提出破解ICT运维运营挑战之道,还重磅发布智算运维、金融卓悦服务3.0、行业通信专网运维三大场景新利器。
举目四望:数智化让运维充满新挑战
当业务纷纷上云,数据遍布云端,ICT基础设施的运维迎来前所未有的考验。
华为网络保障与运维服务领域总裁卢煜谈及ICT运维挑战时指出,随着企业数智化转型,业务数量会增长,产生的数据也将成为企业重要资产。如果网络、设施出现故障,均会对企业造成不可预估的损失。
大家是否记得,2024年2月22日,国外某运营商的部分用户遭遇服务中断,影响超7万名客户。该运营商为此向受影响的每个账户支付5美元赔偿。事故造成的损失更达4000万美元。
由此可见,数智时代,企业对ICT设施可靠性提出更高要求。但智能化发展却导致运维难度增加。卢煜表示:“海量的ICT设备进入各行业,以及业务上云导致业务链路复杂,传统的运维模式、运维技术难以支撑全栈对象和资源管理。”
华为智能运维业务部部长叶荣春分析道,当数字基础设施架构进一步加速向云化、分布式和智能化演进时,给ICT运维带来三大新挑战。
首先,运维对象多。云化、分布式的架构带来硬件,软件,中间件,数据库等对象倍增以及各种形态的终端接入。这就使得网络运维需要纳管并感知更多的要素状态。
其次,业务链路复杂。当业务云化后,运营运维需要跨层、跨云、跨厂家调用数十个服务,才能完成一次业务运维。这也使得业务观测难。
最后,数据应用难。当海量的数据业务与数字技术结合,产生了海量数据。如此多的数据想要挖掘其价值,就需要高质量的数据服务。
拨云见日:以智能为锚点,发布三大新利器
既然数智时代对运维带来如此多的新挑战,运维行业该如何应对挑战?在论坛期间,多位专家均表示,数据分析、人工智能是应对挑战的法宝。
卢煜讲道,随着大数据、智能、大模型等技术的出现,为运维行业带来新的思路和模式。比如,大数据分析可帮助运维行业了解系统运行情况,提高运维效率;智能可实现故障的自动诊断和预测,更可提前采取措施规避事故发生。
IDC亚太地区研究副总裁Simon Piff也认为,智能技术的引入将使能运维在采集、可视化、根因分析、趋势分析、事件关联等方面做进一步的提升。可见,智能成为数智时代运维的法宝。
行业如何手握智能运维利器?笔者注意到,此前,华为已推出智慧政务运维运营、智慧交通运维运营、数据中心运维等多个重点场景解决方案。本次,华为则推出面向专网、智算、金融业务场景的三大利器。
第一把利器:智算运维解决方案
“智算中心基础设施建设进入加速期。”叶荣春强调道。
据中国信通院数据,截至2023年底,中国算力总规模达到230EFLOPS,存力总规模约1200EB。
算力需求增长,也使得ICT设施建设重点从过去的数据中心,向智算中心演进。据中国信通院公开信息,截至2024年5月,我国智算还在建设和规划中,总算力规划272EFLOPS,目前建成运营的只有104EFLOPS。
我们再从企业对智算业务的需求看,智算业务不能出现故障、丢包、拥塞、中断等。以训练任务为例,如果在模型训练时任务中断,训练有可能要从头开始。同时,算力集群的建设,也为智算中心带来海量设备,让运维难度飙升。
为此,华为推出智算运维解决方案,提供“训练任务长稳保障服务”和“算网存全栈主动运维服务”。前者可实现训前任务健康监测,训中任务管理及任务异常诊断。后者可带来事前隐患预测,事中故障快速定位。
叶荣春直言:“智算运维解决方案在移动云和科大讯飞项目实践中,实现万卡集群可用度达到90%以上,故障定位效率从小时级提升至分钟级。”
第二把利器:金融卓悦服务 3.0
智慧金融的发展导致维护对象暴增、全链路监控复杂、故障定界繁琐、自动化效率低等挑战。
面对金融行业智能化发展带来的运维挑战。华为从2020年就面向金融行业推出了金融卓悦服务,满足金融行业运维的差异化需求。4年时光,华为金融卓悦服务已历经1.0、2.0,迭代至3.0版本。
据华为行业运维与提升服务领域总监迟跟元介绍,金融卓悦服务3.0包含稳、早、快、优、高、准的场景化服务能力,面向架构咨询的运维咨询服务,面向人才培养的运维培训服务,以及运维工具平台,一站式端到端的运维服务体系。
《海峰看科技》在论坛了解到,金融卓悦服务3.0相比于2.0版本带来四大能力提升。
提升一:通过构筑同业问题库,把现有经验总结起来,帮助客户消除业界已发生的问题和发现的同业已知问题管理能力。
提升二:通过TRUST体系从技术架构、可靠性、业务性能、安全标准、技术演进五个维度洞察数据中心基础设施的TRUST架构评估优化能力。
提升三:通过构建业务链、数据链、部署链,三链全栈可视能力,帮助客户快速定界云网故障问题的云网故障定界能力。
提升四:基于IMOC华为神农运维平台,帮助客户构建一体化智能运维能力的运维平台能力。
据叶荣春介绍,华为金融卓越服务已向50余家金融客户提供服务,增强了基础设施韧性,提高了运维效率。
第三把利器:行业通信专网运维解决方案
行业专网是行业专网在企业智能化转型中肩负着数据传输、算力调用的责任。但随着企业数智化转型,行业专网面临业务复杂多样,运维低效、无标准流程,运维对象复杂等挑战。
为此,华为推出行业通信专网运维解决方案,可针对家宽提供光缆断点辅助定位,光缆断点定位准确率超过90%;针对企业专网提供了专线故障一键诊断,专线故障定界时长缩短20%;针对农网提供了农网智能故障管理,故障主动识别率99%。
行业通信专网运维解决方案已在实践中带来客观的价值。据叶荣春所讲,在菲律宾某个项目,行业通信专网运维解决方案成功将家宽无效上站次数降低了15%;在墨西哥某个项目,行业通信专网运维解决方案支撑客户VIP专线业务可用率达到99.9%;行业通信专网运维解决方案协助墨西哥客户MTTR缩短10%。
剥丝抽茧:为何华为能成为利器锻造者?
此时,大家不免疑惑,为何华为能成为智能运维利器锻造者?在笔者看来,能打造智能运维利器的企业,既要拥有强大的智能技术储备,又要拥有丰富的ICT运维经验。
纵观诸多ICT设备厂商,华为是为数不多两者兼具的厂商。华为不仅拥有涵盖智能芯片、算法、数据采集、大模型等全栈的智能能力,更是早在2018年推出了自动驾驶网络解决方案,以及智能运维系列产品。
此外,华为自1987年成立以来,一直致力于ICT基础设施的研发和提供。其中,网络运维便成为华为长期关注和投入的重点领域。这也使得华为在网络运维方面积累了丰富的经验。这些经验在智能时代,则成为智能学习的宝贵资源。
正如卢煜所讲,华为在运维运营服务领域围绕异构多元的数据采集和算法技术,基于数字孪生的三链可观测技术、大小模型加速运维走向智能化。
华为在智能运维解决方案利器的打造过程中,并非一把利器走遍天下,而是面向特定业务场景,打造专属智能运维利器。
据叶荣春介绍,华为此前已推出了数据中心运维、智慧交通运维运营、智慧政务运维运营等智能运维解决方案。在本次论坛期间,华为将运维场景利器延伸至更多业务场景,推出了智算运维、智慧金融运维、行业通信专网运维解决方案。
笔者观察:华为成为数智化转型基石的守护者
数智化正成为我国经济增长的新引擎。据中国信息通信研究院发布数据,2023年,中国数字经济规模达到53.9万亿元,较上年增长3.7万亿元,数字经济占GDP比重达到42.8%。
如何保障引擎不熄火?ICT设施运维运营是关键。从本次论坛,笔者看到,华为展现了自身强大的ICT设施运维运营能力及深厚的技术积累,更看到华为基于智能技术,打造的一把把运维运营利器,成为守护数字经济引擎的屏障。
记得多年前,笔者被《可可西里》巡护队员、森林公安及志愿者们在可可西里常年持续守护生态的故事所感动。如今,笔者在本次论坛上看到华为用其30多年的坚守和创新,同样持续守护着各个政企ICT设施的正常运行。笔者也被华为这种守护ICT设施的创新和坚持所触动。
可以预见,在全球数智化转型的征途上,华为将以其强大的运维运营能力和深厚的技术实力,成为各行业加速奔跑的坚实后盾。