“如果把CPU比做大脑、那么GPU就好比是肌肉、而DPU就是神经中枢。”中科驭数CEO鄢贵海在中科驭数2024产品发布会上表示,革命性的产品,绝不仅仅是指标升级,而是深度契合了技术趋势的发展。希望人们以后像记住Intel=CPU,NVIDIA=GPU一样,记得中科驭数=DPU。
DPU作为数据中心的第三颗“主力芯片”,是当下算力基础设施的核心创新之一。随着众多芯片厂商投身到DPU技术领域后,业界对DPU的产品形态定义逐渐清晰,DPU的技术标准也在不断完善。从此,DPU不再是行业巨头的“专享”技术,基础设施与云计算相关产业参与者都在寻求一种简单高效的方法,将DPU的优势运用到自身业务系统之中。
那么,DPU如何成为推动云计算革新的关键力量?2024年7月,由中科驭数、处理器芯片全国重点实验室和中国计算机学会集成电路设计专业委员会主编的《IaaS on DPU(IoD): 下一代高性能算力底座技术白皮书》发布。
该白皮书主要分为六个章节,包括云计算发展趋势、云计算业务模型分析、高性能云计算基础设施建设路径、高性能云计算系统架构持续演进、高性能云计算为PaaS服务赋能、未来展望。白皮书重点阐述了IoD技术的构成,以及与当前主流云计算体系的融合方案,从计算、网络、存储、安全、管控等几个方面进行深度分析,论证了基于DPU构建云计算基础设施服务(IaaS)的性能优势与建设路径。
云计算网络是算力连通的基础,在云计算架构中扮演着至关重要的角色。云计算网络不仅连接着云数据中心内部的各种计算、存储和网络资源,还负责将这些资源与云用户、云服务,以及其他云数据中心相连接。其核心在于通过网络架构与技术实现资源池化和算力的动态分配。这一过程不仅涉及到计算资源的高效利用,还涵盖了网络资源的优化配置,确保数据和计算任务可以在不同地理区域和不同层级的计算节点间流畅传输和执行。
为了将算力基础设施的能力充分发挥出来,云计算系统整体架构也在不断演进。传统的IaaS 平台组件功能全部由CPU算力承载,但是随着对云计算性能需求的提升和极致利用CPU算力需求的发展,基于DPU构建IaaS平台的理念被提出与论证。
IaaS on DPU,简称为IoD,并非全新的概念,而是已经被业内头部企业充分论证过的技术方向,其商业价值也已经经过市场的考验。但是如AWS等企业的DPU与云平台经过高度订制化,难以简单在业内推广开来。随着Nvidia、Intel、AMD等芯片行业的领军企业进军DPU赛道后,如何探索出一条通用云计算系统与标准DPU产品结合的路径成为业内关注的焦点。
白皮书指出,通过IoD技术,可以为云计算体系提供以DPU为核心构造、软硬件一体化高性能计算底座,对外提供统一管理、高可扩展性、高性能、低成本的IaaS服务。在硬件层面为“3U一体”和“一云多芯”的异构算力管理提供更好的解决方案。通过对网络、存储、安全、管理等负载的卸载,释放服务器的硬件资源,实现性能加速,提升基础设施运行效率。此外,通过IoD的统一底座技术,可以为云计算系统提供容器、虚拟机、裸金属业务的统一调度和运维管理能力,提升运维管理效率。
总的来说,IoD技术是从云计算架构视角出发,结合DPU的实际能力,尝试将云计算的网络、存储、安全、管控、运维等尽可能多的能力卸载下沉到DPU,在尽量保证现有技术体系能够平滑演进的同时,又能够为云计算带来巨大的性能提升。
白皮书认为,当前,云计算产业正从单纯的软件主导向着软硬件融合的新模式演进,传统云服务在依赖DPU、GPU 等高性能硬件重构技术体系的同时,也将对产业内各个角色的职责和交互模式进行重新定义。
其一,硬件制造和芯片设计厂商将成为云基础资源的重要提供者。除了传统通用服务器供应商外,GPU和智算服务器厂商将为MaaS等新型云计算服务提供高性能算力基础,而DPU厂商则将围绕异构算力资源和高性能网络充分释放资源潜力、打造3U一体的云计算基础设施。
其二,云服务和软件提供商将重构云计算软件以适应新型基础架构。云计算操作系统和应用将根据全新的基础架构进行设计,以充分利用GPU的并行处理和DPU的任务卸载能力。与此同时,针对新型基础架构的开发框架和服务也将融入云平台当中,成为云操作系统不可或缺的一部分。
其三,芯片、服务器、云服务商等多方联合方案将成为主流。多芯片、多架构组成的云计算基础设施将使单一厂商打造软硬件融合解决方案的难度呈指数性增长,而这将加速产业内各方走向各抒所长、联合打造方案的道路。IoD技术正是多方联合打造的新型技术方案的典型代表。
毋庸置疑,高性能云底座是云计算发展的重要方向,白皮书指出,它的实现依赖产业各方的共同努力。
一是主管部门和行业组织应制定明确的政策和标准,鼓励云计算基础设施的升级和创新。通过税收优惠、研发补助等政策激励,支持本土企业进行高性能云底座相关技术的研发和应用。与此同时,还可以通过组织行业论坛和技术交流会,促进跨行业的合作和技术共享。此外,政府部门还需要推动建立高性能云底座的标准化体系,确保不同厂商的产品和技术能够互联互通,为市场的健康发展提供保障。
二是云服务商和硬件厂商需要紧密合作,共同开发高性能云计算服务和解决方案。通过协作进行技术研发和产品适配,确保DPU等技术能够无缝集成到现有的云计算基础设施中。此外,云服务商还可以通过开展推广活动和技术培训,向用户展示高性能云底座方案在提升计算性能和降低能耗方面的显著优势,并帮助用户更好地理解和应用相关技术。
三是用户企业应积极响应上云用云政策文件,了解和评估高性能云底座方案在其业务中的潜在应用价值,通过主动参与产业链各方组织的试用和测试,提供实际使用中的意见和建议,在帮助完善高性能云底座相关产品和方案的同时,实现基础设施的全面升级和业务的降本增效。