英伟达：创造DeepSeek-R1推理性能世界纪录

观察者网 2025-03-19 11:39:28

（文/汤普济编辑/吕栋）

当地时间3月18日，黄仁勋于GTCAI大会上发表演讲，发布最新一代BlackwellUltraGPU（GB300）。同日，英伟达官方博客发布文章，宣布利用Blackwell架构GPU实现DeepSeek-R1模型推理性能的世界纪录。

英伟达此次利用单个配备八块Blackwell架构B200GPU的英伟达DGX系统，在英伟达评价为“超大规模、最先进的“DeepSeek-R1模型上，实现每用户每秒可处理超过250个token的性能，或每秒最大吞吐量超过30000个token。

NVIDIA

英伟达于2025年1月30日在面向开发者的网站上发布NVIDIANIM微服务版的DeepSeek，之后，英伟达不断通过优化推理生态，刷新DeepSeek-R1模型的吞吐量。英伟达声称，自1月以来，DeepSeek-R1671B模型的吞吐量已被提高了约36倍，相当于每token的成本降低了约32倍。

同时，英伟达声称，纪录还将随着BlackwellUltraGPU和BlackwellGPU在推理性能上的突破刷新。

据悉，英伟达此次发布的GB300是全球首个288GBHBM3EGPU，FP4推理性能可达去年发布的GB200的1.5倍，峰值可达15PFLOPS。将在2025年下半年出货。

英伟达还预览了下一代AI超级芯片——VeraRubin，由RubinGPU和VeraCPU组成。VeraCPU拥有88个定制Arm核心、176个线程。Rubin由两块掩模尺寸的GPU组成，拥有288GBHBM4内存，FP4峰值推理能力可达50PFLOPS，相比GB300，整体性能可达3.3倍。

此外，英伟达还发布了用于加速AI模型推理的分布式推理服务库NVIDIADyamo，据称，在GB200NVL72架构上运行Dyamo推理，能使DeepSeek-R1模型的吞吐量提升30倍。

0 阅读：10

观察者网，提供丰富而专业的国际国内资讯。

作者最新文章

1

Hello泽先生，白宫职场霸凌belike…

2

美乌矿产协定会是泽连斯基的“马关条约”吗……

3

【心智对话】从硅谷到张江：世界科创的旧中心与新势力（下）12月23日，观察者网科创类谈话节目《心智对话》以“从硅谷到张江：世界科创的旧中心与新势力”为主题，邀请上海磐启微电子有限公司董事长兼总经理李宝骐、迦美信芯董事长兼CTO倪文海、中泰证券联席所长兼电子行业首席王芳，分享他们的“芯”看法。

4

【心智对话】从硅谷到张江：世界科创的旧中心与新势力（上）12月23日，观察者网科创类谈话节目《心智对话》以“从硅谷到张江：世界科创的旧中心与新势力”为主题，邀请上海磐启微电子有限公司董事长兼总经理李宝骐、迦美信芯董事长兼CTO倪文海、中泰证券联席所长兼电子行业首席王芳，分享他们的“芯”看法。

5

2022年2月24日，俄罗斯的一场军事行动无意中掀开了全球格局的新剧变。俄乌之间的军事较量，迅速演变成全球大国力量博弈的新战场。三年后的今天，在特朗普2.0时代，美国抛弃欧州盟友，与俄罗斯单独展开会谈。在多极化世界加剧形成的背景下，俄乌冲突能否迎来新的转机？中国又将承担何种角色？俄乌冲突三周年之际，观学院直播厅特别邀请中、俄、欧三方专家权威解读。

6

李迅雷：不要担心补贴打水漂，消费乘数效应比修高铁大得多

7

李迅雷：调整期就是买入时机，但千万不要追涨

8

陆挺：如果发钱，应该要优先发给我们亏欠的人

9

陆挺：如果大家都只买二手房，房地产就很难真正企稳

10

温铁军：靠农村消费稳经济我们有经验，但今天还有这个条件吗？#经济学家建言2025中国经济

热门分类

军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球健康房产家居星座旅游健身时尚科学探索职场育儿股票教育影视情感热点推荐热榜中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期青骄第二课堂少年风超级父母麻辣老师街拍恋爱攻略婚姻情趣正能量