当AI遇到5G核心网,一场“运维范式革命”正在发生

闫跃龙 2024-06-27 10:23:17

2024年的MWC上海展最大的热点,莫过于5G/5G-A和AI。5G/5G-A与AI正在碰撞出无限可能,其中也包括核心网领域。

在被称为“5G网络大脑”的核心网,一场智能化的运维范式革命正在悄然发生。

网络可靠性的攻防战

将事故消灭在萌芽中

2021年4月,加拿大第一移动通信网络运营商Rogers Wireless旗下的Fido Solutions发生超大规模的断网事故,近千万用户受到影响。最终,这场事故的罪魁祸首被找到了,是云化的核心网出了问题。

无独有偶,根据媒体公开报道统计,过去三年来全球发生的核心网事故数增长了52%,中断时长增长了70%,影响用户数增长了50%,给发生事故的运营商带来了巨大的损失。

为什么会这样?其中一个重要原因是云化和分层增强了核心网的不稳定性。云化,是5G的基础,5G带来巨大的数据流量增长,其中绝大多数都发生在边缘。要驱动百倍的边缘网关建设,就需要强大的云化平台来支撑5G核心网实现敏捷高效、弹性随需的关键能力。而云原生所提供的微服务、容器等云化技术将使得整个网络更可靠、更灵活、更敏捷。然而,云化也天然地给核心网的可靠性带来巨大挑战,因为网络云化后,复杂性从此前的硬件转移到了软件。

如何既充分利用云化的优势,又避免云化所带来的网络可靠性问题?答案是人工智能。据TM Forum ANL测试试点的结果,人工智能对AN(自智网络)等级的提升至关重要,尤其是在运维阶段,人工智能可以帮助运营商实时监控网络状态,主动发现网络隐患,快速感知故障并进行自动诊断、修复。可以说,人工智能是运营商迈向高阶自智网络的关键技术路径。

值得注意的是,除了人工智能,数字孪生技术也在网络可靠性保障中起到重要作用。数字孪生可以在仿真环境中建立5G核心网的网络模型,对网络的运行情况进行模拟,帮助运维人员分析和优化网络配置。

以华为推出的核心网运维智能解决方案ICN Master为例,就借助大模型、数字孪生可视、智能化算法等技术实现了运维智能。站在运营商的角度,最直接的价值是网络状态的可视化,可以清晰地看清以往如黑盒子般的云化核心网状态。华为ICN Master打造了云网拓扑可视统一前台,一屏展示业务层、网络层、网元层、虚机层、硬件层五层信息。当网络状态实时可视,也就为网络故障的查、改提供了坚实基础。

运维智能的另一个典型场景,是网络评估。以往,网络评估都是靠人工,这种方式不仅耗时长,而且依赖于经验,导致隐患发现难度大。华为ICN Master实现了在线仿真评估,以信令风暴智能防控方案为例,就可以实现10分钟现网仿真,全网协同流控实现参数整网最优。

可以看到,在AI、数字孪生等技术的加持下,云化核心网既要敏捷、又要高稳的矛盾被破解了,鱼与熊掌皆可兼得。

一场运维的范式革命正在发生

运维智能,给运营商带来的影响是深远的。

传统的核心网运维模式,是“资深专家+工具”的模式,但是这种模式对专家的要求极高,拿信令分析这个投诉及故障问题分析的关键手段来说,由于核心网信令流程多、交互行为复杂,只有在核心网领域具备多年经验的专家才能具备分析能力,技能门槛高,手工分析耗时长。据了解,培养一名合格的核心网工程师至少需要1~3年时间才能具备某一方面较强的能力。要成长为全面的高级别专家需要花费更长的时间。

显然这种模式很难维系越来越复杂的运维态势。不仅是因为云原生、全融合的持续演进以及容器化、微服务化等的引入让网络复杂性呈现指数级增长,对专家的要求愈来愈高。而且,即使好不容易培养出来一个专家,如果花费大量精力在繁琐的故障查杀中,也是杀鸡用牛刀,带来人力资源的极大浪费。

对于运营商来说,还在于日益增长的故障数量与运维人员无法增加的矛盾。据中国某运营商的统计数据,过去三年故障工单数增长了30%,但运维人员却维持不变。如何解决这个矛盾?答案就是运维智能。运维智能,可以将运维模式转变为“智能体+人工辅助”的新模式,让智能体代替资深专家的角色,从而实现网增人不增,用更低的成本实现网络高稳。

以浙江移动联合华为打造的5G核心网运维的“数字助理”和“数字专家”为例,基于鸿图智能体的“投诉分类助理”,可以精准提取投诉工单中的关键字段,基于高频投诉场景,实现更精准的投诉分类,投诉问题分类准确率从40%提升到90%以上。另一个“信令分析专家”可以让普通员工通过对话式问答轻松进行信令分析,并给出推荐根因和相关案例参考,信令分析单环节的耗时可以从4小时大幅降低到5分钟。

因此,大模型正在重构运维,大大降低运维的门槛,从GUI操作到自然对话,从依赖规则与专家经验的分析到以智能系统为中心的泛化分析,从复杂的命令式接口集成到基于意图驱动的集成和验证,普通运维人员也可以成为运维专家的时代来了。

运维范式革命的另一重意义,在于可以像中医那样“治未病”,即从问题的被动解决到主动预防。无论是可视化的网络状态监控,还是网络风险的在线仿真评估,都像是对网络可以持续体检,主动发现问题、解决问题,将问题消灭在萌芽中。以上面提到的华为推出的智能信令风暴防控方案为例,就从网元按月级评估到网络级分钟级评估,从小时级定界缩短到分钟级定界的转变,实现了信令风暴场景从事后被动处理到事前主动预防的巨大转变。

可以看到,运维模式的变革,对于运营商带来的是运维效率的极大提升,这有助于运营商在激烈竞争的市场环境中居于有利地位。

后记:运维智能筑牢网络底座

在最近TM Forum 举办的DTW24(Digital Transformation World)上,核心网自智网络高稳测评标准首次亮相,并披露了最近对核心网自智网络等级试点的评估。10家全球领先运营商的测评结果显示,当前在核心网故障管理场景下,运营商平均等级可达到L2.54水平,其中基础高稳部分的平均水平已达到自智网络等级L3,正在向L4高阶自智网络迈进。这表明,核心网的运维智能已经具备了清晰的演进路径和比较完善的测评标准。

当运维与智能碰撞,碰撞出的是一场运维的范式革命,碰撞出的是云化核心网的坚如磐石。这场运维智能的变革对于运营商的价值巨大。一方面,可以提升网络的可靠性,大幅降低核心网事故发生概率;另一方面,可以大幅提升运维效率,降低运维成本。总之,一句话:运维变革将能为运营商构筑坚实的网络底座。

当然,当网络底座坚如磐石,也将助力运营商在业务上提升敏捷度和竞争力。以浙江移动为例,其应用场景化数据配置大模型、运维RPA机器人等技术,提升了开通效率,将开通时长从过去的5个工作日缩短到1个工作日,实现了5G专网的极速业务开通,运营商可以更好地助力千行万业的智能化转型。

2024年是5G-A元年,云化核心网的这场运维智能化革命,同样将为5G-A的发展奠定坚实基础。从这次MWC上海展来看,5G-A与AI正在碰撞出无限可能,“联人、联家、联物、联车、联行业”的“五联”将升级为更加纵深的“五智联”,而这些丰富多彩的创新业务无疑对网络的要求更高,包括运维智能在内的核心网智能化将会更加扮演重要角色。

TM Forum调研报告显示,全球91%的运营商已经制定了自动化战略并有清晰的投资计划。核心网正在智能化的加持下,脱胎换骨,不断刷新智简、高稳和质优的新高度。

0 阅读:18

闫跃龙

简介:剖析“互联网+”行业大变局,寻找其中的大机会