高性能GPU芯片如何实现自主可控？上海打造多源GPU智算中心

随着"智算中心"建设的推进，视频渲染和人工智能（AI）/机器学习（ML）的训练任务对算力的需求呈爆发式增长，如何满足人工智能（AI）、高性能计算(HPC)和其他数据密集型工作负载的日益增长的需求，建设一个高性能的智算中心成了建设者们首要考虑的问题。

国产GPU已实现相对自主可控

GPU的中文意思是图形处理器，在个人电脑里属于标配，俗称“显卡”。与电脑里的CPU（中央处理器）相比，GPU的串行计算能力不强，但可以有强大的并行计算能力，即能够在同一时间做大量比较简单的运算。

看到GPU的这个差异化性能特点后，英伟达公司走出了一条与英特尔不同的发展道路，研发出可用于人工智能领域的GP-GPU（通用图形处理单元）。这类芯片是GPU的升级版，即中国科协十大产业技术问题提到的高性能GPU，其功能不再局限于处理图形，而是主要用于人工智能系统的训练和推理。随着人工智能大模型的兴起，GP-GPU的市场需求量大幅增长，让英伟达一跃成为全球市值最高的企业。

由于英伟达的高端芯片被禁止出口到中国大陆，“自主可控高性能GPU芯片开发”就成为一个重要问题。令人欣慰的是，近年来国产高性能GPU芯片发展很快，华为昇腾、天数智芯、沐曦、摩尔线程等多个国产GPU已经问世，并投入应用。

“在产业生态方面，国产GPU在油气探查、天气预报等一些行业应用领域实现了相对自主可控。”徐步陆说，“同时，在与国际主流GPU兼容这条发展路线上，国产GPU也占据了一定的智算市场份额。”

智算中心需要算力最优解

AI具有更强的推理能力，距离落地解决具体问题的步伐也就更进一步，人工智能推理新阶段将至，算力需求将大幅提高，大模型需要怎么的算力？

如今，国内的智算中心建设如火如荼。建设智算中心的城市，已从北京、上海、深圳等一线城市延伸到了县域级地区，一场全国范围的算力基础设施建设正在推进中。

智算中心大批量建设，但算力的实际使用率很低。中国产业经济信息网的报道显示，目前国内算力闲置率很高，算力中心的整体利用率仅有50%。这其中不乏算力中心性能不足、无法满足大模型时代的算力需求、数据中心和当地产业需求不匹配等问题。以算力规模、集群规模来评价算力性能的时代已经落伍，算力需求已进入由量到质的转变时代。

早在全球数字经济大会之际，北电数智即提出过“算力最优解”的理念，随着人工智能行业与算力需求的迭代发展，北电数智对算力评价标准进一步系统化，“算力最优解”需要做到“三加一保障”，即加速单芯片算力，加强混元异构集群性能，加大通信能力，保障智算集群训练安全、稳定运行。

免责声明：

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证，并在此声明不承担信息可能产生的任何责任、任何后果。

2、本号非商业、非营利性，转载的内容并不代表赞同其观点和对其真实性负责，也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误，负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网，所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品，请与我们取得联系，我们会及时修改或删除。

世良情感网

高性能GPU芯片如何实现自主可控？上海打造多源GPU智算中心

玩数据还有点懒