在日前由工信部和湖南省政府举办的2023世界计算大会有关论坛上,中国工程院院士倪光南发表了题为《打造算存运高效协同的算力基础设施》的主旨演讲。他在演讲中指出,数字经济以数据资源为关键要素,数字基础设施是数字经济时代的“高速公路”,运力、算力、存力三者协同发展,数字基础设施才能发挥数据的要素价值,充分释放数字经济活力。
中国工程院院士倪光南
相关数据显示,美国存算比为1.11TB/GFlops,而中国为0.42 TB/GFlops,仅是美国的37.8%。倪光南表示,当前AI算力中心蓬勃兴起,但对算力基础设施理解有片面性。存力、算力、运力共同构成数字基础设施核心底座,对于AI智能计算中心,中国算力中心要重视存力、算力和运力均衡配置,不能偏废失调,才能取得最大的经济社会效益。
其中,高运力充分释放算力+存力,实现算力提升20%。高运力具备高网络数据吞吐能力,是算力和存力充分释放的关键。网络丢包、流量不均,则数据传输低效,增加计算和存储等待,算力性能显著降低。
高存力充分释放算力,实现GPU/NPU利用率提升30%。高存力通过全局元数据、算子下推、向量检索、缓存加速等数据加速引擎,可缩短数据预处理周期、提高训练集加载效率和推理准确度、减少训练中断,GPU/NPU利用率有效提升。
据IDC预测,2025年全球数据总量将达到175ZB,其中中国产生的数据量预计将达48.6ZB,跃居为全球第一。然而,随着数据量的快速增长,对算力和存储性能也带来极大的考验。
倪光南建议,中国算力中心要建设领先的运力设施,用更领先的网络构建千亿物联能力;打造坚实的算力设施,在通用计算、人工智能计算等多样性计算不断突破;构筑可靠的存力设施,让数据存得下、跑得快、用得好。
第一,产业发展,标准先行。为促进产业更好的发展,以“行标”或“团标”的方式,发布“算力中心建设指南”,提出“算力”“存力”“运力”的适当比率范围;提出“存力”中采用SSD先进存力的适当比率范围,提出“运力”应该具备的参数指标等要求,避免大力发展算力中心建设中的某些倾向,均衡部署,均衡发展,抢占新一轮科技革命和产业变革的制高点。
第二,政策引导,存储设备力推SSD取代HDD。在政府采购、招标等项目中,应优先支持SSD,不得以单一价格指标作为评标依据;重要基础设施的存储设备,政府应政策引导,指定采用国产SSD以此促进国产SSD的产业发展。网络设备指定国产自主可控网络设备以促进网络核心技术自主创新。
第三,安全测评,公平公正。从“网络安全就是国家安全”的高度,重视对数据通信产品、算力的芯片及基础软件平台的安全审查工作。可以参照信创工作经验,对构成广义算力的存算运的关键核心技术实施“自主可控测评”,根据第三方测评机构给出的自主可控测评分值作为选择依据。使AI算力中心建设、“东数西算”、新基建等成为拉动中国新一代信息技术发展的内循环的强大动力。
第四,千秋大业,人才为先。重视高校人才培养。存储、通信和计算产业都是技术密集型产业,产品研发需要大量具有存储、通信和计算技术研发能力的人才。以存储为例,北美有60+高校开展存储领域研究、领军教授80+、博士团队500+;西欧有20+高校开展领域研究、领军教授30+、博士团队200+;目前国内在这方面存在差距,还要加大力度。为此建议在高校要增设存储、通信和计算专业、课程、实验室等,扩大人才培养规模,并从收入、激励机制、基本公共服务等多角度构建新的人才政策,吸引并聚集国内外优秀人才。
第五,集聚产业,协同攻关。建议将数据存储和通信列入信创范围,与上下游产业协同促进国产信息技术生态发展。同时设立国家科技攻关计划和相关产业链中数据存储和通信专项,组织国内产学研用各界联合攻关,实现全产业链风险可控;成立国家实验室、国家级科创平台等,开展前沿技术研究,形成原创性成果,提升国产存储和通信全球技术竞争力。
倪光南总结道,鉴于算力基础设施在我国加快建设数字经济的重大作用和新一轮科技革命和产业变革中的重要地位,当前应发挥我国新型举国体制优势,统筹规划、提前布局,产业协同攻关计算、数据存储和数据通信网络的前沿创新技术,争取在打造算存运高效协同的算力基础设施方面走在世界前列,实现算力基础设施的高质量发展,为科技强国建设和数字经济发展提供坚实支撑。