芯片再遇危机,英伟达被限制供货高端GPU,GPU究竟有多重要?

科技铭程 2022-09-03 18:05:45

大洋彼岸的那帮人又对我们下手了!

8月31日,英伟达接到通知,对中国区断供用于人工智能和数据中心的顶级计算芯片。接到该通知的还包括AMD。

英伟达这次断供的产品主要是 A100 和 H100 GPU。

据悉,英伟达是全球顶级的GPU(图形处理器)供应商,创建于1993年,CEO为美籍华人黄仁勋。

此次事件对我们会造成哪些影响呢?那就要从GPU开始谈起了。

GPU是什么?与CPU有何不同?

1999年英伟达提出GPU概念,它和CPU一样就是一块小芯片,不同的是GPU通常出现在显卡上,CPU是在主板上的。

在当时,GPU主要应用在大型网络游戏中,并没有引起人们的重视,因此发展的比较慢。

GPU的发展主要经历了三个阶段:

第一阶段:图形渲染阶段,这是GPU的初衷,从命名中就可以看出。GPU全程为Graphic Processing Unit,翻译成汉语就是“图形处理单元”。

第二阶段:浮点运算,人们发现把浮点运算进行包装,做成图片渲染任务,就可以使用GPU处理了,这可比玩游戏强多了。

第三阶段:自主学习,随着AI、无人驾驶技术的快速发展,深度学习的需求越来越高,而GPU恰好应用在这些领域,于是GPU开始快速发展。

近几年,GPU的应用场景开始成指数级的增加,AI、云计算、大数据、无人驾驶、金融、医疗、游戏、超算等等,都需要一款高性能的GPU。

所以当有人问你GPU有什么用时,不能在傻傻的说玩游戏了。

GPU与CPU有哪些区别呢?

CPU即中央处理器,它是由运算器、控制器、存储器等组成,负责信息处理、程序运行、数据处理等。

CPU的各指令之间是有严格顺序的,必须严格按程序规定的顺序执行,才能保证计算机系统工作的正确性。

即:计数器>译码器>时序发生器>运算器>寄存器。

这种处理数据的方式有一个弊端,那就是当数据太大时,无法满足需求。

为了处理更多的数据,提高CPU效率,不得不加大CPU的集成度,晶体管的数量也不断的增加,核心数也越来越多,但仍然无法满足庞大的数据处理。

随着图片、视频数据的增加,CPU无法满足需求,GPU则应运而生。它是专门处理图片、视频的核心处理器。

GPU由存储器、数/模转换器、算术逻辑单元、少量存储器组成。

GPU的控制系统相对简单,且不需要很大的存储器,大部分晶体管被用于算数逻辑单元,因此GPU的计算速度大增,拥有强大的浮点运算能力。

人们认识到GPU比CPU更适合庞大的密集的数据处理,同时具备高度并行性,于是GPU开始用于其他领域,例如人工智能、云计算。

2016年,谷歌“阿尔法狗”以4:1的成绩击败了世界围棋冠军李世石,震惊了世界。人们惊叹人工智能的厉害。

此后阿尔法狗在中国棋类网站上注册账号Master,连战60局无一败绩。

阿尔法狗的厉害就在于它使用了1202个CPU、176个GPU,约有800多万核并行计算,不仅可以模仿人类,还可以自主学习,甚至边下棋边进化。

可以说在新兴市场上,相比CPU,GPU似乎更受欢迎。这也为GPU领导者英伟达带来了巨大商机。

为了快速抢占市场,英伟达不断的快速迭代,从早期的K系列、M系列、P系列、V系列,到如今的高端GPUA100、H100,英伟达几乎成为了GPU的代名词。

英伟达的A100 和 H100有多强?

在经历了十多年的人工智能、大数据的发展后,英伟达的GPU被证明是流行的、数据密集型深度学习方法的完美匹配。

随着AI、无人驾驶的快速发展,英伟达不断的迭代发展,最终打造出了A100和H100两款性能极高的GPU。

A100:

A100是英伟达于2020年5月发布的第八代GPU,依然采用了安培架构。

A100采用了台积电7nm工艺,集成了540亿个晶体管,其性能也比上一代 V100提高20倍。而且它是一块 3D 堆叠芯片,面积高达 826mm^2,GPU的最大功率达到 400W。

同时,A100还支持多实例技术,可将一个A100 分割成7个独立的小型GPU,从而实现多个任务同时计算,大幅提高利用率。

据黄仁勋介绍,A100是专门为无人驾驶量身打造的。

随着智能汽车的快速的发展,无人驾驶技术需求量越来越大,模拟训练的算力在短短3年内增长了3000倍,这迫切需要一款强大的算力芯片。

而英特尔也全力以赴的打造全新产品,A100就是其中之一。小鹏、法拉第FF 91都采用了这款GPU。

你以为A100很强了,但在H100就显得普普通通了。

H100:

H100相比A100有6大突破:

1、高度集成

H100 采用台积电5nm工艺制程,集成800亿个晶体管,显著提升了AI性能、显存带宽、互连通信速度。

H100可实现3TB/s 的显存带宽,以及5TB/s的互联网速度。

2、性能提升

在神经网络中,“H100的峰值性能达到了A100的6倍”。在其他网络中,峰值性能也达到了2—3倍左右。

神经网络让自监督学习成为可能,这将是未来机器学习的主要模式。

此外H100的数据吞吐量也比上一代产品高出 30 倍,可实现次秒级的延迟度。

3、多实例

H100同样拥有多实例技术,不仅可以把单个GPU分拆为7个,同时进行不同的运算任务,而且还可以将部分能力扩展7倍。

4、加密计算

H100是全球首个加密计算GPU,之前的加密计算都只用在CPU上。

H100的加密计算可以在不影响性能的前提下,保护用户数据、隐私等,是金融、医疗、云计算领域的最佳GPU。

5、高互联性

H100大幅提升了互联性能,通过英伟达的NVLink进行连接,可有效连接256个H100,带宽提高9倍。

这项突破可以将机器学习速度提升9倍,之前需要2个月的时间,采用H100后只需要1周。

6、动态规划

H100还可以加速动态规划,优化路径。算法比上一代GPU提升7倍。

这种加速可以应用在物流机器人的巡线,DNA、蛋白质的排列,从而大幅提高效率。

H100的多项技术突破,带来了更高的计算性能,大幅提高了学习效率,同时也进一步扩大英伟达在GPU领域的领导能力。

英伟达还研发了一款超级人工智能计算机——Eos,号称是世界上最快的计算机。

Eos采用了Hopper架构,搭载了4600个H100 GPU,比世界最快的超级计算机Frontier,还要快1.4倍。

没有高端GPU会有哪些影响

高端GPU主要用于高性能计算领域,包括科学计算,计算机辅助工程,医疗等方面。

高性能计算领域首推国家超算中心,超级计算机有数千个CPU、GPU组成,具备十分强的计算能力,是计算机中的珠穆朗玛峰。

超算可以应用于天气预报、矿产勘探、核工业、尖端武器等多个领域,如果缺少GPU,那么会大大的影响超算的能力,也影响到这几个领域的发展。

计算机辅助工程,对大型工程尤为重要。

福特号航空母舰为什么那么先进?有很大一部分功劳是计算机的功劳。

福特号是第一艘采用计算机辅助功能设计的航母,成功解决了航母内部布局问题,对于细节的把控更加到位,大大缩小了建造误差。

这项技术的应用,还可以让福特号可以多方位同时开建,大大地提高了航母的建造效率。

除了航母、大型的楼宇、广场、铁路、公路、桥梁等等都在采用计算机辅助设计,甚至装修一套房子也会用到。

工程量越大所需要的计算机性能越强,越需要高端GPU,如果没有,轻则工期延期、浪费人力、物力、财力,重则工程失败。

在医疗领域,英伟达的GPU可以提供更高效、清晰的3D人体模型,医生们可以通过医学成像来诊断和治疗疾病。

人工智能模型被应用于患者的数据中,可以有效地分析出患者需要何种治疗方案,同时加密功能还可以有效保护患者的隐私。

在无人驾驶领域,机器可以采集大量的数据来进行自我学习。

如今的学习已经是深度学习了,它不像传统的模式,需要培养、研究。它只需要通过神经元网络进行。这种学习模型更加准确,更加便捷,但也需要更强大的GPU。

越来越多的企业已经布局自己的数据中心,例如:三大运营商、互联网企业、华为、中兴等高科技企业。

它们所采用的GPU通常是英伟达的A100、H100产品,因为这些产品都具有足够双精度计算能力。

可以说,如果英伟达断供高端GPU,那么超算、人工智能、大型工程、数据中心等等都将受到波及,甚至会扩大到整个互联网领域。

如果考虑到这些领域的上下游企业,那损失就太大了。怎么办呢?加快自主研发,实现国产替代。

那么国内GPU企业成色如何呢?能担得起这个重任吗?

国产GPU如何

国内GPU企业其实也不少,大大小小有20多家。包括景嘉微、摩尔线程、璧仞科技、芯瞳半导体、天数智芯、兆芯、龙芯、华为海思等等。

在AI和超算领域,主要有璧仞科技、芯瞳半导体、天数智芯等。

可惜,这些企业真的不够打,恐怕加起来也比不过英伟达。不过璧仞科技还算争气,新品壁仞 100,号称打破了全球的算力记录,对标的英伟达的高端的GPU。

壁仞 100基于壁仞科技原创芯片架构研发,采用7nm制程,可容纳770亿颗晶体管,具有高算力、高通用性、高能效三大优势。

16位浮点算力达到1000T以上、8位定点算力达到2000T以上,达到国际厂商在售旗舰产品3倍以上。

但实际上,它的算力真的比不上英伟达的 H100

英伟达 H100,16位浮点算力达到2000T以上、8位定点算力达到4000T以上,算力是壁仞 100的2倍,同时H 100采用了5nm工艺,集成了800亿晶体管,工艺制程、集成度更高。

在图片处理方面,主要有景嘉微、芯动科技、摩尔线程,但说实话,这些厂商的GPU与英伟达最少差距5年,甚至更多。

玩游戏,做图片、视频,大家肯定选英伟达,英伟达卖的货越多,资金越雄厚,研发投入越多,GPU也就越先进。而国产厂家正好相反。

因此,一个良性循环,发展越来越快,一个恶性循环,发展跟不上。

此外,还有一个最令人担心的,就是制造环节。

英伟达可以找台积电代工,制造5nm GPU,国产企业找谁呢?一旦制造环节再出问题,即便设计出高端GPU,也只能停留在实验室。

写到最后

尽管在很多领域,我们实现了追赶超越。但是在新品领域,我们仍有很大的差距。无论是EDA软件,芯片设计还是芯片制造。

因此,我们更加需要团结,集中力量逐个突围,从关键需求到日常生活。

盲目的大规模的上马新项目,反而会造成资源浪费,统筹规划,科学发展更为关键。

记住,每一次进步都是一次胜利,无数次胜利才能换来超越!

我是科技铭程,欢迎共同讨论!

0 阅读:230

评论列表

小潇

小潇

3
2022-09-03 21:42

想依附美国点高科技产品一去不复返了。我不知道,无理在哪,违反世贸规定还是双边协定?若不是,难与无理挂钩,相反,自己还有强买强卖嫌疑。强自身,是不二法则,别无它路。

科技铭程

科技铭程

喜欢科技,喜欢聊科技,更喜欢分享科技。