【全球云观察 | 科技热点关注】
当下的AIGC时代,算力领域面临的最大挑战是什么?
对于这个问题,仁者见仁,智者见智。但答案中最吸引业界眼球的莫过于,算力调度。为什么呢?
「因时而生」:多元异构算力爆发,催生算力调度神器
AI大模型新兴技术正在加速各个行业的新洗牌,当然行业洗牌必然有一个过程,在这场前所未有的创新变革中,算力成为其中的核心支撑。然而,算力发展却面临着诸多挑战。
就事论事,不如举个例子来得更有说服力。
以某城市智慧城市算力统筹调度平台建设为例:算力供需缺口大,现有算力资源分布不均衡,不仅资源分散,而且单一的算力供给模式难以满足各类应用场景对算力的个性化需求。当前处在数字经济发展的关键时期,千行百业在奋力实现数智化转型,加上大模型行业应用落地也在不断加快,由此,千行百业对AI算力、通用算力甚至超算的需求明显增长,将多元算力价值发挥出来,实现多元算力汇聚的算力网建设也就迫在眉睫。
同时,统筹推进城市算力互联网建设,可以实现城市算力需求与国家枢纽节点算力资源高效供需匹配,在很大程度上,也可以有效降低算力使用成本。
此外,随着算力运营监管要求越来越高,要提升算力运营和监管水平,加强全市算力基础设施动态监管评估,那么必须得有一个统一的算力平台来实现。
基于这些挑战与需求,该城市打造了自己的智慧城市算力统筹调度平台,进一步强化算力基础设施设计、建设、运营全生命周期管理,锚定“算力一网化、统筹一体化、调度一站式”的定位,实现多元供给、强算赋能、泛在连接、安全融通的初步算力理想。
全球云观察分析发现,此城市的智慧城市算力统筹调度平台建设愿景非常明确,就是要充分发挥算力统筹调度平台作用,拉通撮合算力供需两侧,优化资源配置,促进市场公平,保障服务质量,维护用户权益,推动行业标准建设,打造安全、可信、普惠的算力服务创新平台。当前推进的效果已经初现,相信随着行业发展的加速,会让更多的供需端受益。基于平台赋能千行百业,该城市未来将进一步统筹优化算力基础设施布局,强化多元算力供给与调度,以及提高算力赋能服务水平。
以实际行动,引领算力与云计算的发展,成功打造智慧城市算力统筹调度平台。探索其成功背后的力量,离不开中国电信天翼云的创新助力,更离不开“息壤”算力调度神器。
事实上,不只是这个城市有着强烈的算力统筹调度平台的诉求,在当下这个AI时代,千行百业都有着AI重塑带来多元异构算力统筹调度的直接需求。
一是,随着数字新基建如火如荼进行,通用算力、智能算力、高性能超级算力、边缘多元算力也得到了繁荣发展,这就促使行业用户在算力选择上,需要面对多元化供给的算力服务商,即来自电信运营商、云厂商、数据中心运营商、算力设备供应商等提供多元化的算力资源。
二是,国产GPU、CPU取得蓬勃发展的同时,行业用户具体应用场景面对国内外不同算力架构,在算力架构多元化下如何实现不同架构算力之间的高效调度,实现真正的互联互通。
三是,“东数西算”国家战略工程正在进行,要实现跨地域长距离的算力并网与调度存在一定挑战,在带宽、时延、高可靠性上如何得以保障。
在解决跨服务商、跨架构、跨地域的算力调度壁垒上,天翼云自主研发的算力分发网络平台“息壤”做到了。天翼云应AI时代所需,打造算力调度神器,“息壤”真正实现了多元算力一体化。
「顺势而为」:打造算力分发调度能力,“息壤”有何与众不同?
为了保障算力分发调度畅通,从一开始研发,天翼云就按照超广覆盖、超高可靠、超低时延、超大速率、云网一体的标准要求,以期满足千行百业对算力的极致需求。
在《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》的政策指引下,建设融合通用计算、智能计算、超级计算资源的算力服务平台,加强多元算力互联互通和统一服务,促进算力供给、调度、使用及结算智能化,这样“息壤”的出现,也就顺理成章了。
以政策作为先导,以算力互联网的行业趋势作为方向,天翼云打造算力调度神器,“息壤”可谓应时而生,顺势而为。然而,近年来,业界不少ICT厂商也推出了各种各样的算力调度平台。那么,“息壤”到底有什么与众不同呢?
算力接入,创新突破。“息壤”首创算力插件,研发算力网关,建立算力度量体系,这一系列创新突破,给业界算力调度带来了新气象。
天翼云科技有限公司研发专家曾介绍,算力调度第一大“拦路虎”,便是标准化。GPU、CPU、DPU等国内外算力架构五花八门,各有各的规矩,各有各的道理,实现算力互联网的明天,首要任务就是要实现异构算力接入标准化。
就此,天翼云研发算力插件实现异构算力接入标准化,研发算力网关支持社会闲散算力云化纳管、安全接入。同时还建立算力度量体系,使得异构算力可统一衡量。基于此,“息壤”收到算力需求后,可根据实时感知的算网状态进行资源编排和调度,提供算力最优解。这不仅为行业用户多元异构算力带来直接的帮助,而且也为算力优化提供了最有力的平台与工具。
算力服务,三管齐下。为了提升算力服务能力,天翼云研发算数协同技术,毕竟算力最终还是要为数据服务,这有助于算力更好支撑数据价值的洞察。同时实现AI导引,帮助行业用户实现更为优化的算力选择与供给。而且,值得一提的是,天翼云突破多层级算力调度技术,实现更为灵活、智能的网络支撑,针对节点、节点间、集群间、区域城市间多层级算力网络建设,强化调度的感知能力。
算力生态,互联互通。既然是要打造算力调度神器,自然就少不了整合算力需求方、供给方、运营方的能力与资源,唯有打破先前的壁垒,方能从真正意义上构建开放的算力伙伴生态,实现算力资源汇聚、流动、共享。在“加快形成全国一体化算力体系,培育算力产业生态”方面,“息壤”通过算力伙伴共赢计划引入优质第三方算力,提供一站式通智超边算力服务,致力于打造全国算力一张网。
值得关注的是,“息壤”除了提供公共的天翼云自营算力服务平台,还为各个地方提供私有化部署的区域算力互联互通平台,目前已经在多个城市实现商用落地。
由此,汇聚并实时感知通算、智算、超算、边缘多元算力,“息壤”对跨服务商、跨地域、跨架构的算力进行统一管理和调度,实现多元异构算力供需的高效匹配。
2024年5月升级之后的“息壤”,因为已经攻克算力插件、算力网关、算数协同等一系列关键技术,支持第三方算力与天翼云自有算力并网,从而实现智算更普惠。更进一步分析来看,在六大主要指标与性能上,升级后的算力分发网络平台“息壤”遥遥领先于业界。
在算力调度本身的能力方面,目前已支持业内主流云厂商、超算厂商、智能算力厂商的算力统一接入和调度。
在算力交易方面,运营服务层是面向场景化的算力交易入口,并且面向业务高质量服务需求的计算、存储、网络等资源,都实现了一体化供给。
在调度算法和精度方面,基于算法的精确性、高效性,支持算法自优化,满足不同的场景下的调度需求。
在及时响应率方面,已经实现毫秒级的延迟,从而实现行业用户在算力调度上的更低延迟。
在生效及时性方面,实现了毫秒级全网策略生效,这意味着“息壤”在调度算力上实现更好的实时性。
在平台安全性和可靠性方面,提供云原生高可用架构、数据传输和存储加密,提供可信任、可追踪、可记录的交易管理。
虽然主要指标与性能领先业界,值得关注,但是“息壤”最大的与众不同,是其远大的未来理想,让全网算力随愿可得。
「乘势而上」:实现算力一体化,加速算力产业高质量发展
曾几何时,业界一直有一个理想,让算力可以像水、电等基础能源一样,按需索取,按量供给,实现灵活高效的弹性。
现在,“息壤”让理想照进现实,天翼云以自主研发的创新能力,凭借优秀的算力调度能力,“息壤”获得业内广泛认可,并成功入选国务院国资委“2022年度央企十大超级工程”。
很显然,天翼云始终如一地坚持着科技创新。
对此,天翼云科技有限公司智能边缘事业部副总经理、息壤产品线总经理鄢智勇表示,算力互联互通与算网一体化调度是解决数据高效流动、优化算力资源布局及数据流动的关键手段,这也是数字中国建设的必然发展趋势。
面向未来,乘势而上。全球云观察分析认为,中国电信天翼云打造的“息壤”算力分发网络平台,给算力业界的发展带来了重要参考与行业价值。
其一,全域算力,互联互通。算力最大的壁垒来自服务商、技术架构与跨地域,“息壤”通过创新的技术与服务,实现全域算力的互联互通与调度,通过算网感知、随愿自治的跨域调度能力为应用匹配最优算网资源。目前“息壤”单集群调度性能每秒超过2000+实例,全网调度规模达20EFLOPS。
其二,实现算力一体化,加速产业高质量发展。天翼云通过“息壤”平台,致力于打造全国算力一体化调度、算力资源跨区域高效配置的基础设施,赋能千行百业深入数智化转型,持续释放多样化算力的动能,推动算力产业高质量发展。
“息壤”广泛的适用领域包括了当下业界最为关注的通用计算资源池调度,东数西算类场景的东数西训、东数西存和东视西训场景,以及云渲染业务、AI分布式训练、GPU虚拟化调度、GPU资源池调度。
其三,国云赋能,战略支持。“息壤”平台全面支撑和服务“东数西算”国家战略工程,为社会提供普惠算力服务,从而更好地助力双碳目标实现。
由此可见,应时而生、顺势而为、乘势而上的“息壤”,持续优化多元异构算力调度,未来的路必将越走越宽,越走越广。
况且,多元异构算力调度的帷幕,才刚刚拉开。
- END-
你
怎
么
看
?
欢迎文末评论补充!
【全球云观察|科技明说|全球存储观察 |阿明观察】专注科技公司分析,用数据说话,带你看懂科技。本文和作者回复仅代表个人观点,不构成任何投资建议。