NVIDIAH20性能曝光,比H100降低28%

科技有点奇谱 2024-07-13 03:26:21

面对美国政府对尖端人工智能(AI)芯片的出口限制,又不想失去中国市场,英伟达不得不设计了符合规定的H20 Hopper GPU,取代了以往销售的A800和H800。但是H20与全球热卖的H100的差距到底有多大,英伟达并没有透露。

《金融时报》发布的中国市场的AI芯片性能对比图

据Wccftech报道,H20近期现身Geekbench 6,显示其核心数量比H100减少41%,性能降低28%。

根据Geekbench 6测试数据,H20配备78组SM,搭载GH100芯片完整的配置为144组SM,不过实际的H100产品中没有全部打开,其中SXM5版本中启用了132组SM,而PCIe 5.0版本则启用了114组SM。相比最高配置的H100,H20的内核数量减少了41%。

此外,H20配备了96GB的HBM3内存,比原始H100的80GB要高,但低于新版H100的144GB HBM3E内存;同时H20的带宽为4.0 TB/s,低于顶级H100的8.0 TB/s。

性能方面,NVIDIA H20的INT8为296 TFLOPS,FP16为148 TFLOPS,TF32为74 TFLOPS,FP32为44 TFLOPS,而FP64只有1 TFLOPS。此外,H20配有60MB的L2缓存,支持多达7个多实例GPU,8路HGX配置,900 GB/s的NVLink带宽,TDP为400W。

在OpenCL测试中,H20的成绩为248992分,H100 80GB版本大概在280000分,如果是拥有132组SM的H100可达350000分左右,配备了144GB HBM3E的H100分数就更高了。

尽管如此,H20在国内依然大卖。半导体行业研究机构SemiAnalysis给出的预测称,英伟达的H20芯片在中国有望在未来几个月内交付超过100万颗。

0 阅读:7

科技有点奇谱

简介:感谢大家的关注