高性能GPU芯片如何实现自主可控?上海打造多源GPU智算中心

玩数据还有点懒 2024-09-14 22:16:35

随着"智算中心"建设的推进,视频渲染和人工智能(AI)/机器学习(ML)的训练任务对算力的需求呈爆发式增长,如何满足人工智能(AI)、高性能计算(HPC)和其他数据密集型工作负载的日益增长的需求,建设一个高性能的智算中心成了建设者们首要考虑的问题。

国产GPU已实现相对自主可控

GPU的中文意思是图形处理器,在个人电脑里属于标配,俗称“显卡”。与电脑里的CPU(中央处理器)相比,GPU的串行计算能力不强,但可以有强大的并行计算能力,即能够在同一时间做大量比较简单的运算。

看到GPU的这个差异化性能特点后,英伟达公司走出了一条与英特尔不同的发展道路,研发出可用于人工智能领域的GP-GPU(通用图形处理单元)。这类芯片是GPU的升级版,即中国科协十大产业技术问题提到的高性能GPU,其功能不再局限于处理图形,而是主要用于人工智能系统的训练和推理。随着人工智能大模型的兴起,GP-GPU的市场需求量大幅增长,让英伟达一跃成为全球市值最高的企业。

由于英伟达的高端芯片被禁止出口到中国大陆,“自主可控高性能GPU芯片开发”就成为一个重要问题。令人欣慰的是,近年来国产高性能GPU芯片发展很快,华为昇腾、天数智芯、沐曦、摩尔线程等多个国产GPU已经问世,并投入应用。

“在产业生态方面,国产GPU在油气探查、天气预报等一些行业应用领域实现了相对自主可控。”徐步陆说,“同时,在与国际主流GPU兼容这条发展路线上,国产GPU也占据了一定的智算市场份额。”

智算中心需要算力最优解

AI具有更强的推理能力,距离落地解决具体问题的步伐也就更进一步,人工智能推理新阶段将至,算力需求将大幅提高,大模型需要怎么的算力?

如今,国内的智算中心建设如火如荼。建设智算中心的城市,已从北京、上海、深圳等一线城市延伸到了县域级地区,一场全国范围的算力基础设施建设正在推进中。

智算中心大批量建设,但算力的实际使用率很低。中国产业经济信息网的报道显示,目前国内算力闲置率很高,算力中心的整体利用率仅有50%。这其中不乏算力中心性能不足、无法满足大模型时代的算力需求、数据中心和当地产业需求不匹配等问题。以算力规模、集群规模来评价算力性能的时代已经落伍,算力需求已进入由量到质的转变时代。

早在全球数字经济大会之际,北电数智即提出过“算力最优解”的理念,随着人工智能行业与算力需求的迭代发展,北电数智对算力评价标准进一步系统化,“算力最优解”需要做到“三加一保障”,即加速单芯片算力,加强混元异构集群性能,加大通信能力,保障智算集群训练安全、稳定运行。

免责声明:

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。

2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。

1 阅读:18

玩数据还有点懒

简介:感谢大家的关注