4月11日,国家超算互联网平台上线。
截至目前,国家超算互联网平台已建立起运营体系,连接10余个算力中心和软件、平台、数据等200余家技术服务商,同时建立源码库,3000余个源代码覆盖百余行业千余场景。
4月11日,国家超算互联网平台上线。
2023年4月17日,科技部高新司在天津启动部署国家超算互联网,提出到2025年底形成技术先进、模式创新、服务优质、生态完善的总体布局。同时,由22家单位发起组成了国家超算互联网联合体,截至2024年3月底已有128家成员单位加入联合体。
国家超算互联网计划在各算力中心之间形成高效数据传输网络,并构建全国一体的算力调度网络和面向应用的生态协作网络。如今,已启动一年的超算互联网工作进展如何?
2023年4月17日,科技部高新司在天津启动部署国家超算互联网。
发展超算是必然趋势
算力是当代生产力,超级计算也被称为高性能计算。
近年来,我国算力中心建设已取得显著成绩,算力水平已经成为衡量一个国家科技与经济水平的重要指标,但面对AI和大模型的发展,全社会对算力提出更高要求,算力中心亟需突破现有单体运营模式。
而超算互联网是具备互联网理念与特征的超算基础设施,是互联网化的高性能计算服务环境,是互联网创新成果与算力基础设施运营的深度融合。国家超算互联网的建设目标是连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,以互联网思维运营算力中心,紧密连接算力供需双方。
随着国家实施“东数西算”工程以来,以新型数据中心、超算中心、智算中心为代表的算力基础设施正加速部署。截至目前,我国已启动建设8大国家级算力枢纽节点和10个数据中心集群,已建成十多个国家超级计算中心,超40个城市在建智算中心,25个国家新一代人工智能公共算力开放创新平台获批建设,全国一体化算力网正加快构建。
当前,国家超算中心已经初步形成国家超算网格,对国家科技创新、经济发展起到重要支撑作用。从超算中心到生产线,再到产业生态,超级算力正在不断转化为生产力。
中国超算势不可挡
早前,图灵奖得主、美国田纳西大学创新计算实验室和信息科技研究中心主任、美国国家工程院院士杰克·唐加拉(Jack Dongarra)在接受采访时表示,中国的超算能力可能超过了所有国家,他暗示中国可能已经投入使用了3台E级超级计算机,其性能与美国的E级超级计算机“Frontier”相当,峰值性能甚至更高。
从初代的“银河”“曙光”到近10年中连续5年占据世界第一的“天河”和“神威”,中国在超级计算机方面发展迅速,从空白走向与美国、日本媲美,成为继美国、日本之后第三个能独立设计和研制世界顶尖超级计算机的国家。
当前,科技部批准的国家超级计算中心共计十多个,分布在天津、济南、无锡、昆山、深圳、广州、长沙、成都、郑州、西安、太原、文昌、重庆、乌镇等地。这些超算中心,除了文昌航天超算中心、中新(重庆)国际超算中心外,其他中心都已经投入运营。
此外,近年来,清华大学、中国科学院计算机网络信息中心、国家超级计算济南中心、鹏程实验室、中科曙光等多家单位分别从原型体系研究、高速互联网络、大规模数据传输、全国一体化算力调度、区域算网生态建设、标准研制等方面,开展试验与探索。
据了解,中国科学院计算机网络信息中心持续优化建设具有基础设施形态、服务化特征的国家高性能计算环境CNGrid。中科曙光在2020年正式上线全国一体化算力服务平台(ac.sugon.com),实现了对全国十多个算力中心资源的整合与统一任务调度,聚合双精计算能力超过1000PFlops。鹏城实验室在2022年发布“中国算力网(China Computing NET,CNET)”计划,利用新一代通信、网络技术实现国家大型算力高速互联。
超算互联网发展任重而道远
毋庸置疑,超算互联网将催生一系列新机制、新模式、新业态,帮助用户降低使用门槛,推动算力中心竞合发展,促进产业生态紧密协作。超算互联网的应用价值,更多体现在超算使用门槛的大幅降低,应用软件生态的自主自强,以及对众多应用场景的泛在支撑。《超算互联网白皮书》指出,超算互联网的发展仍存在一些挑战。
第一,加强理论研究与技术攻关。超算互联网的发展在体系结构、关键技术、管理体制、运行机制、商业模式、标准规范等诸多方面面临挑战,需要在政府统筹支持下,通过设立长期科技计划专项,持续推动产业界、学术界紧密协作,不断探索创新,努力前行。
第二,推进关键领域应用示范。行业应用是超算互联网的服务目标,也是其发展的助推器。支持有能力、有条件的超算中心打造有特色、有优势的领域应用服务平台,提高用户服务能力,同时遴选若干国家重大战略应用,给予重点支持,发挥多超算中心协同优势,吸引软件、数据、模型等生态伙伴共同参与,解决国家亟待解决的重大问题,形成生态协作的标杆示范。
第三,持续完善超算互联网标准规范。为实现算力按需调度、数据可信流通、应用开箱即用、模型可上网等目的,需要业界共同努力,持续构建和完善超算互联网标准规范体系。在资源接入与输出、资源测量感知与标识、应用封装、数据共享、性能调优与评测、服务质量评价等各方面,逐步形成一套行业广泛认可、行之有效的标准体系,包括统一接口、标准、规范、流程、协议、架构、指南、最佳实践等。
第四,强化产教融合培养超算人才。我国超算领域人才缺口极大,特别是在先进算法、并行编程、大模型、工业软件、交叉研究、行业超算应用等方面,制约着超算应用水平的提升。应当以产业应用需求为引领,面向国产芯片自主生态建设目标,优化产教融合模式,为各行业领域持续培养和输送高水平、高技能的并行计算人才。
第五,促进数据开放共享与流通。超算互联网的发展离不开成熟、规范、活跃的数据要素市场。在国家“数据要素×”行动计划统一部署下,围绕科技创新、工业制造、应急管理、气象服务、城市治理、医疗健康、金融服务等领域,应按照“开放为常态、不开放为例外”的共享理念,推进各领域数据开放共享与流通,同时保障好数据安全,促进大数据分析、大模型预测、AI For Science、开放科学等新范式的普及应用。
第六,构建超算互联网区域枢纽节点。超算互联网的建设需要与区域经济社会发展紧密结合,围绕重点区域的资源优势和发展需要,建设超算互联网区域枢纽节点,以线上线下相结合的方式,充分汇聚区域内算力、算法、数据、人才等相关资源要素,形成区域一体化算力服务网络和生态协作网络,支撑区域产业转型升级与智能社会治理。
第七,与中国算力网等计划协调发展。在国家推进“东数西算”工程的背景下,算力资源的基础设施化、算力网络融合化发展受到广泛重视。目前,国内存在多个算力网络相关计划,包括鹏城实验室的“中国算力网”计划,中国移动、中国电信、中国联通等运营商的算网融合计划等。超算互联网需要与各大工程计划加强沟通协调,着重在高速网络数据传输、异构算力共享调度、“东数西算”应用创新、统一接口规范等方面有效协作,为加快构建全国一体化算力网提供保障支撑。