赛迪顾问数据显示,2020年中国DPU产业市场规模为3.9亿元,预计到2025年中国DPU产业市场规模将超过565.9亿元,年复合增长率高达170.6%,全球DPU产业市场规模将超过245.3亿美元,年复合增长率为51.73%。
DPU,即Data Processing Unit,是以数据为核心的专用处理器,被称为是数据中心中CPU、GPU之后的第三颗主力芯片。
那么,在AI催生下算力与数据爆发的新阶段,DPU对更强劲的算力意味着什么?在AI时代该如何重新定义?
“抢滩”DPU
当前,DPU的产业价值已成共识。2023年10月,工信部等六部门联合印发的《算力基础设施高质量发展行动计划》强调,DPU在提升算力效率、优化算力质量、促进绿色低碳算力发展等方面的关键作用。这一政策的出台,标志着DPU在国家战略中的地位得到了正式确认。
清华大学教授、中国工程院院士郑纬民在中科驭数2024产品发布会致辞中表示,芯片是算力的核心,是算力提升的关键所在。DPU芯片被称为数据中心中继CPU、GPU之后第三颗主力芯片,它作为数据处理器承担着数据网络传输、存储、计算、安全等任务,是重要的新型算力基础设施。
中科驭数CEO鄢贵海表示,如果把CPU比做大脑、那么GPU就好比是肌肉、而DPU就是神经中枢。CPU承载了应用生态,决定了计算系统是否可以通用;GPU提供了高密度各类精度的算力,决定了系统是否有足够的“力量”;DPU负责数据在各种CPU和GPU之间高效流通,决定了系统是否能协同工作。“三U一体”(CPU、GPU、DPU)成为主流算力节点发展趋势。
在国际上,英伟达、英特尔、AMD、微软等厂商都已经积极布局DPU。NVIDIA收购Mellanox后,凭借原有的ConnectX系列高速网卡技术,推出其BlueFicld系列DPU,成为DPU赛道的标杆。AMD相继收购算法加速芯片头部厂商的Xilinx和Pensando的目的更明显。继Intel收购Xilinx的竞争对手Altera后,在通用处理器的基础上,进一步完善硬件加速能力,Intel 2021年6月新发布的IPU产品(可以被视为Intel版本的DPU),将FPGA与Xeon D系列处理器集成,成为了DPU赛道有力的竞争者。几乎同一时间,Marvell发布了OCTEON10 DPU产品,不仅具备强大的转发能力,还具有突出的AI处理能力。
国内GPU厂商在加速攻坚之际,国内DPU赛道也站满了各路玩家,如移动云、天翼云、华为等通信企业,阿里云、腾讯、百度、字节跳动等互联网巨头,以及一些DPU创业公司中科驭数、星云智联、云脉芯联、云豹、大禹智芯、益思芯、芯启源等均在各展神通。
毋庸置疑,DPU产业已经成为国内外竞争的新焦点,在未来数据中心、智算中心等高带宽、低延迟、高吞吐率产品都将发挥重要作用,为“东数西算”、算力网络等重要新型算力基础设施建设提供核心组件。
重新定义DPU
DPU是当下算力基础设施的核心创新之一,被寄予了数据中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比数据网络的高铁时代,已经不仅仅是连通城市问题,而是彻底重构了地理位置的逻辑距离。
从国内来看,中科驭数是率先完成三代DPU芯片研发迭代,并成功实现规模化商用的DPU厂商。中科驭数的目标是为算力基础设施提供一流的DPU产品,解决算力资源的弹性扩展、高效互连、加速计算、统一运维等关键问题,打通数据中心算力的“堰塞湖”。
其中,6月19日,正式发布的国内首颗量产全功能DPU算力芯片——中科驭数第三代DPU芯片K2-Pro DPU芯片,是专为破解大规模数据中心性能瓶颈而生的高效能数据处理芯片,采用自主研发的KPU架构,集网络、存储、安全及计算等多业务卸载功能于一体,包处理速率翻倍至80Mpps,最高支持200G网络带宽,具备高度可编程性,确保了系统的灵活扩展性,为数据中心的业务增长和算力扩容提供坚实基础。在处理复杂任务时,K2-Pro相比上一代芯片能耗降低30%。作为一款纯国产的高性能解决方案,K2-Pro适用于云计算、智能计算、及高性能计算等领域,助力数据中心应对日益增长的规模和性能需求。
此外,在2025年,中科驭数将完成K3芯片的发布,采用最新KPU架构以及KISA 2.0指令集,集成RISC-V轻量级控制核,处理带宽将是K2-Pro的四倍,达到800G,延迟低于1微秒,功耗比K2-Pro下降40%。中科驭数还将在算力基础设施领域布局“芯云计划”。
基于此,中科驭数已经不单单将DPU视为单一芯片,而是从三个维度重新定义其价值。第一,架构决胜,用最先进的芯片架构来重新定义DPU芯片架构。第二,软件护城,用最高兼容性来重新定义DPU的软件系统。第三,平台上门,用最低的成本让客户接入DPU规模化部署与业务验证。
历时六年,立志成为有信念、有追求、有敬畏、有技术的“四有新人”的中科驭数清晰地知道,趋势并不能确保中科驭数的成功,时代只会给真正创新的企业以回报,只会给效率至上的企业生存空间。驭数人有一个执念,就是不仅要把DPU做成一个产品,更要把“驭数”做成一个品牌,做成一个在数字时代助力数字中国的品牌,成为这个时代趁势而上的企业。
“革命性的产品,绝不仅仅是指标升级,而是深度契合了技术趋势的发展。”鄢贵海表示,希望人们以后像记住Intel=CPU,NVIDIA=GPU一样,记得驭数=DPU。
DPU产业应用落地开花
目前,DPU系列产品高效赋能各行各业,已成功为金融、通信、交通、数据中心等众多领域提供算力底座支持,DPU产业已经到了应用落地开花的关键阶段。
首先,在云计算方面。头部云厂商纷纷启动自研芯片计划,而且研发重点都是面向数据处理器的高性能专用处理器芯片,希望以此改善云端的服务器成本结构,提高单位能耗的性能水平。数据研究预测,DPU在云计算市场的应用需求最大,且市场规模随着云计算数据中心的迭代而增长,到2025年,仅中国的市场容量都将达到40亿美元的规模。
其次,在智算中心领域。以AIGC应用来看,DPU在智算中心中的关键作用与价值主要有支持超大规模组网算力互连、支持100G+超高带宽、通过使用RDMA来提供模型训练所需超低时延和抖动、其NVMe- oF技术可提供更高效的存储读取和处理能力等四方面。
再次,在5G通信领域。在5G通信网络快速发展的过程中,算力和网络融合发展需要更加绿色高效的数据处理硬件加速技术,亟待DPU提升系统性能。DPU将在高性能数据处理、低延迟数据传输、网络管理、存储,以及安全等基础设施底层建设发挥关键作用。DPU通过接手CPU不擅长的网络协议处理、数据加解密等数据处理任务,不仅可以提高网络传输效率,而且释放了CPU算力资源。在新型算力DPU的加持下,能够提供灵活高效的硬件加速服务,支持云基础设施层功能卸载,云边协同、云网一体都将逐步实现。
最后,在金融行业。金融信创已步入深水区,由“边缘替代”迈向“核心替代”。核心交易系统对网络时延的需求从毫秒级提升到微秒甚至纳秒,低时延网络领域的核心设备长期被国外厂商Solarflare与Mellanox垄断,时延和安全问题成了制约银行、证券、期货等行业发展的难点之一。而自主研发的低时延网络DPU卡构建超低时延网络,可支撑金融交易核心链路从底层硬件到上层应用系统具备超低时延、低抖动、完全自主可控等特性,在超低时延网络领域真正打破垄断,实现国产升级替代。
值得一提的是,DPU的潜在市场非常巨大。虽然国内厂商在芯片产品化的环节还相比国外一线厂商还有差距,但是在DPU架构的理解上还是有独到见解的,而且我国目前在数据中心领域,无论是市场规模还是增速,特别是用户数量,相较于国外都有巨大的优势。国内厂商有望充分利用这一“应用势能”,加快发展步伐,在DPU这个赛道与国外厂商逐鹿中原。