运营商智能AI算力网络打造数字经济新引擎

薪科技快评 2024-03-27 09:38:49

运营商算力网络整体发展情况

运营商洞悉算力趋势,推出“算力网络”理念,以网强算,把握东数西算战略脉搏,积极推进算力发展。一年多来持续创新,充分发挥网络优势,全力推动算力网络发展。

运营商算力网络核心理念

算力网络:新型信息基础设施,赋能数字化转型

算力网络以算力为中心,融合网、云、数、智等多维要素,提供一体化服务。目标是实现算力泛在、算网共生,构建智能编排、一体服务的社会级算力基础设施。

通过“一点接入,即取即用”,算力网络将算力变为普惠服务,赋能数字化变革。实现“网络无所不达,算力无所不在,智能无所不及”的愿景,推动各行业高效创新和经济增长。

算力网络演进路径

算力网络发展历经泛在协同、融合统一阶段,最终走向一体内生。届时,算力将像水电一样,实现“一点接入,即取即用”,成为支撑数字经济高质量发展的社会级服务。

运营商体系化推动算力网络创新发展

主线一:面向算网基础设施构建——完善算力基础设施布局

物理融通

连接数据中心,释放泛在算力

通过连接国家算力枢纽,完善“4+N+X”数据中心布局,实现不同地域算力的物理融通。目前,数据中心机架已超 120 万架,为企业和个人提供强大的算力支持。

逻辑融通

融合云、边、端计算,构建无缝算力协同体系。从300+云中心延展至1500+CDN边缘节点,推进1000+边缘云节点建设,实现算力融合、万物互联。

异构融通

推进算力多样化,打通通用与专用算力互融互通之路。超过 60 万台多样化算力服务器(x86、ARM 等)正通过多种方式(合营/转售、API 对接、云原生)融入社会算力网络,加速算力普及。

主线一:面向算网基础设施构建——打造以算为中心的基础网络

构建三级时延圈,赋能网络稳定性:

- 骨干:20ms,确保跨区域通信流畅。

- 省域:5ms,提升省内数据传输效率。

- 市域:1ms,实现本地网络极速响应。

向算而生构建网络新架构

• 扩大网络覆盖,DCI云专网覆盖超320个地市

• 提升网络Mesh度,减少流量绕转,降低时延

• 提升网络带宽,向400G/800G演进

技术创新打造网络新能力

• 通过SRv6/G-SRv6技术提升网络调度能力,实现多种业务的差异化保障

• 网络切片提供确定性连接服务

• 新一代SD-WAN高效分发算力服务

主线二:面向业务融合创新——构建融数注智的算网大脑

算网大脑:算网协同的关键引擎

统一调度和管理算网资源,实现算力、网络跨域协同。向下融合泛在算力,向上提供融合能力,支撑算网一体化服务。

算网能力开放--算网原子能力融合供给

算网融合编排--多要素一体编排

算网跨域调度--跨领域、跨专业统一调度

算网智能化--意图感知、网络自智

算网数据感知--算网全域感知,端到端服务质量保障

主线二:面向业务融合创新——开创算网服务1.0

算力服务体系升级:

融合多元要素,创新服务模式,打造算力化和产品化的综合服务,提升可靠性、效率、智能和便捷度。

①以网强算让业务品质更可靠更安全

3AZ高品质资源池

业界首创3AZ自研架构,8节点布局全国,提供业内最高L6级多活容灾服务,保障数据99.99999%可用性。

②算网融合让客户体验更高效更便捷

云网一体产品

云专网节点覆盖全国所有地市全网用户一跳入网、算力高速互联。

③算网赋能让服务模式更灵活更多元

5G*云,双引擎持续赋能行业

算力赋能生产力,加速产业数字化转型。融合 ABCDNETS 能力,提供任务式服务,让算力即取即用,助力千行百业数智升级。

主线三:面向创新技术引领——构建创新技术体系

构建创新算力体系,推动技术齐头并进

运营商深入探索算力网络关键技术,系统布局提升算力、强化网络、融合服务的技术集群,通过三层架构横向映射、技术栈纵向串联,形成协同发展体系,加速算力技术全面成熟。

创新技术1:广域吞吐敏感网络技术(1/5)

国家战略驱动下,海量数据广域网传输需求激增。多云备份、异地上云等场景要求高吞吐在线数据迁移。实现广域网海量数据高吞吐传输已成燃眉之急。

东数西算战略下,构建高效的数据传输网络至关重要。为迁移95%的温冷数据,实现数据高效利用和节能,需要广域网具备高吞吐能力,确保数据按时保质迁移。

通过广域网实现多云数据备份、协同计算和大数据迁移,有效满足云业务需求。网络吞吐影响迁移成本,同时需保证低时延、高安全和可靠性。

创新技术1:广域吞吐敏感网络技术(2/5)

p当前广域网大数据迁移存在的问题

对于海量数据传输(数以 TB 或 PB 计),FTP 吞吐量不足。人工硬盘快递耗时长,存在数据丢失和损坏风险。

• 原因1:物理带宽不高,存在带宽上限。通过建设超宽骨干网,消除物理瓶颈

• 原因2:现有广域网拥塞控制算法准确度不高,有效吞吐存在瓶颈

广域网拥塞控制算法通过监测丢包、时延和带宽等指标,在复杂多变的网络环境下优化数据传输。随着网络拓扑和业务类型多元化,以及设备异构性的增加,拥塞控制算法不断演进,旨在最大化物理带宽利用率,满足不同业务需求。

创新技术1:广域吞吐敏感网络技术(3/5)

RDMA技术凭借其高速数据传输能力,将数据处理任务从内核卸载至网卡,有效提升数据传输效率,成为数据高效传输的理想选择。

RoCEv2协议易部署、性能高,但应用在丢包率较高的广域网中需要优化其原生实现

创新技术1:广域吞吐敏感网络技术(4/5)

广域吞吐敏感网络 (WGSN) 突破性架构,实现网络数据传输的卓越性能:高吞吐量、增强安全性、低算力消耗。

创新技术1:广域吞吐敏感网络技术(5/5)

p广域吞吐敏感网络目标

在有限资源下,实现网络、数据和算力的三维动态平衡,优化网络吞吐、保障数据可靠、降低算力损耗,为业务保驾护航。

p 关键技术

高速、高效、安全的网络连接解决方案

* 优化拥塞控制:精准测量单向延迟和可用带宽,优化广域网络拥塞控制算法,提升传输效率。

* 高效丢包重传:精准检测丢包,采用精确重传机制,消除原生丢包重传缺陷,确保数据完整性。

* 快速丢包恢复:利用前向纠错码,降低链路丢包率,无需额外重传时延,大幅提升传输性能。

* 安全数据传输:采用传输层加密技术,保障数据安全传输,不受路由协议影响,确保信息机密性。

云间数据迁移市场规模庞大,年增长率达 25%。目前,TB 级数据迁移常采用人工快递硬盘的方式,受制于网络吞吐限制,效率低下。广域吞吐敏感网络应运而生,它提升网络有效吞吐,使线上迁移 TB 甚至 PB 级数据成为可能,大幅提升效率和用户体验,降低成本。

创新技术2:算力路由(1/3)

自2018年起,我们致力于算网融合研究,解决云边协同和边边协同中的“性能反转”难题。我们的创新方案在路由域引入计算信息,实现联合调度,有效提升网络和计算资源利用率。

基于BPG协议实现算力感知和路由,在网络距离向量上叠加计算向量。设计自适应算力通告机制和多因子算路算法,优化算力和网络资源,提升边缘计算效率。

BGP,互联网骨干网的关键路由协议,是制定互联网标准的唯一权威。基于BGP的创新,需要对核心TCP/IP协议进行复杂改动,难以实现。

CAN 协议簇集结了 CA-BGP、CA-BGP-LS、CA-OSPF、CA-Netconf/yang、CA-Restful/json 等技术,赋能算力感知、路由调度和配置管理的创新。

此外,运营商推动成立算力路由工作组,担任主席一职,将算力网络原创技术推向国际舞台。

在网计算将数据处理任务卸载至网络设备,释放算力资源,大幅提升计算效率。在算力网络体系中,智算中心网络、高性能云网络等场景对性能要求极高,在网计算可有效加速业务处理。

加速AI模型训练

提升异构融合网元处理性能

总结与展望

算力网络旨在融合网络与计算,推动算网一体化发展。作为跨学科技术,它包含一系列科学与工程难题,需要系统化布局与解决。

三大主线助力算力网络创新:

* 基础设施构建

* 业务融合

* 技术引领

促使关键技术从理论迈向产业实践。

构建算力网络面临交叉技术难题,亟需产学研合作,跨界融合。携手突破技术瓶颈,促进产业繁荣,赋能数字化转型升级,构建新型基础设施,为新时代插上腾飞之翼!

-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

1 阅读:30

薪科技快评

简介:薪科技评说,发现技术的点滴,记录科学的飞跃!