由Deepseek引发的国内大火的训练推理一体机的最大竞争对手来了!

冷谈哥 2025-03-04 04:57:59

自从Deepseek发布开源AI大模型以来,引发各行各业都在进行AI大模型赋能热潮,由于各种这样或那样的原因,很多组织和公司比较青睐用训练推理一体机来实现这个目标,而英伟达“迷你超算”即将大规模推向市场,即将成为国内大火的训练推理一体机的最大竞争对手。

长期以来,一直有传言称GPU 英伟达(NVIDIA) 计划在2025 年进军消费级CPU 市场的消息。而如今,我们可能已经第一次看到了它新的进展。

The verge 报道,在CES 2025上英伟达推出了新款的Project Digits,这是一款价值3,000 美元的个人AI 超级电脑,由新设计的Blackwell 架构GB10 Grace 超级芯片来提供算力。报道指出,英伟达执行长黄仁勋向投资者和分析师暗示,该芯片当中与联发科共同开发的Arm 架构的CPU 未来有更大的计划。

黄仁勋在一次投资者演讲中提到新的20 核心CPU 时表示,我们有我们的计划。但他表示,他会在未来告知这些计划是什么。不过,由于合作厂商联发科也有自己的企图心,所以黄仁勋强调,联发科也可能将新的独立CPU 推广于市场,不完全与英伟达合作。因此,他们可以向我们提供,他们可以自己保留并服务市场,这使得该计划成为一个伟大的双赢局面。

事实上,英伟达新推出的Project Digits 本身并不是一款大众市场产品。因为其售价高达3,000 美元,并且以执行专为AI 开发人员设计的客制化Linux 系统为主。

最近,据一些外国媒体报道,英伟达(Nvidia)和联发科(MediaTek)已经收到大量关于其GB10 Grace Blackwell超级芯片的订单,这些芯片将用于Project Digits低成本个人AI超级计算机,预计这种强劲需求将持续到2025年底。这两家公司已经要求代工合作伙伴台积电(TSMC)以及封装和测试合作伙伴日月光(ASE)和京元电子(KYEC)增加产能。目前这些芯片已经开始生产,并将于今年下半年开始发货。

“Project DIGITS”是什么?NVIDIA方面将其称之为“目前体积最小的AI超算”。

这是一款大约只有饭盒大小的PC主机,从发布会上的演示视频来看,它可能与大家熟悉的Mac mini,或是那些较小的x86 NUC差不多大小。

在“Project DIGITS”内部,却并不是常见的低电压移动版PC平台,但是NVIDIA称其称之为“超算”,确实是一点也没吹牛。

因为Project DIGITS使用了一颗定制的“GB10”超级芯片,它在一个核心里融合了基于Blackwell架构的GPU,以及NVIDIA与联发科、ARM三方合作研发的Grace CPU。

根据相关技术资料显示,其中的Blackwell GPU能够提供1PFLOPS的FP4算力,同时Grace CPU则包含了10个Cortex-X925核心和10个Cortex-A725核心。在GPU和CPU之间,则是通过大型超算同款的NVLINK-C2C芯片到芯片互联总线连接。

除此之外,Project DIGITS还配备了一颗独立的NVIDIA ConnectX互联芯片,它可以让“GB10”超级芯片内部的GPU兼容多种不同的互联技术标准,其中包括NCCL、RDMA、GPUDirect等,从而使得这颗“大核显”可以被各种开发软件和AI应用直接访问。

在存储配置上,Project DIGITS则提供128GB的LPDDR5X统一内存,并直接预装了4TB的NVMe SSD作为存储空间。

英伟达Project Digits有哪些特点和优势?

英伟达的 Project Digits 具有以下特点和优势:

强大的硬件配置

高性能芯片 :搭载 NVIDIA GB10 Grace Blackwell 超级芯片,由 Blackwell GPU 和 20 核的 Grace CPU 组成,可提供 1 PFLOPS 的 FP4 AI 计算性能,能够轻松运行超过 2000 亿参数的大语言模型,通过叠加两台 Project Digits,可支持处理参数高达 4050 亿的大语言模型。

大容量内存和存储 :配备 128GB LPDDR5X 内存和 4TB NVMe SSD,为处理大型数据集和复杂的 AI 模型提供了充足的内存和存储空间。

先进的接口和技术 :支持多种接口类型,兼容性强,采用先进的 DRAM 芯片和 NAND 存储技术,提高了数据的传输速度和读取写入速度。

便捷的软件环境

预装操作系统和工具 :搭载基于 Ubuntu 22.04 的 Linux 操作系统 DGX OS,预装了完整的 AI 开发工具链,包括 SDK、编排工具、PyTorch 等 AI 框架,以及来自 NVIDIA NGC 目录的预训练模型和资源库,开发者无需进行复杂的配置即可开始工作。

优化的 AI 软件 :包含多项优化、附加驱动及诊断 / 监控工具,如 NVIDIA NeMo 框架和 RAPIDS 库等,助力开发者将工作部署至云端和数据中心。

高性能与高效率

快速的 AI 训练 :利用每秒一千万亿次的 AI 能力,加速了 AI 模型的训练、微调和测试过程,开发人员可以更快地进行迭代,减少部署时间。

高效的数据处理 :通过先进的存储技术和接口,提高了数据的读取和写入速度,在处理数据密集型的 AI 计算任务时表现出色。

成本效益高

降低云端费用 :在本地提供强大的计算能力,削减了经常性的云端费用,对于处理大型数据集的团队和初创公司、研究团队来说非常理想。

一次性投资 :相比传统的基于云端的人工智能服务,Project Digits 只需一次性投资,无需持续的订阅费用或隐藏费用。

可扩展性强

灵活的扩展方案 :可以通过叠加使用的方式提升处理能力,以支持更大的 AI 模型,为 AI 领域的应用提供了更多的可能性和灵活性。

适应不同规模项目 :既适合小型团队和个人开发者,也适用于大型企业,能够随着需求的增长而扩展。

紧凑且节能

体积小巧 :这款超级计算机体积紧凑,可置于桌面,相比传统的 AI 设备,不再需要笨重、昂贵的硬件。

能耗低 :使用标准电源插座即可运行,具有较高的能效比。

重点介绍英伟达Project Digits主机的叠加能力可分为以下几种情况:

1. 官方明确支持的叠加数量双机互联:英伟达官方指出,单台Project Digits可处理2000亿参数的大模型(如Meta Llama 3.1的4050亿参数版本),需通过双机互联实现,即两台叠加后可支持4050亿参数模型的运行。

互联技术:双机通过NVIDIA ConnectX网络接口连接,带宽达400Gbps,确保数据传输效率。

2. 理论扩展潜力与第三方分析多机互联可行性:部分第三方评测认为,Project Digits支持通过以太网扩展更多设备。例如,8台互联可形成环形拓扑结构,共享内存达1TB,适合大规模模型推理或低延迟训练需求。

实际限制:

带宽瓶颈:若叠加过多设备,网络带宽可能成为性能瓶颈,影响生成速度(如Token/s)。

适用场景:多机叠加更适合教育、研究或企业级推理等对实时性要求不高的场景,而非需要高吞吐量的实时训练。

3. 叠加后的性能与应用场景算力提升:单台Project Digits的AI算力为1 PetaFLOP(FP4精度),叠加后算力线性增长,但实际效率受互联带宽限制。

成本优势:相比传统显卡集群,8台叠加总成本约2.4万美元,显存容量达1TB,性价比显著高于购买多张高端显卡。

总结官方支持:双机叠加,满足4050亿参数模型需求。

扩展潜力:理论上可连接多台(如8台),但需权衡带宽与性能平衡。

推荐场景:优先选择双机互联应对主流大模型,多机扩展适用于非实时推理或实验性研究。

这个英伟达推出的超级计算机会成为训练推理一体机的强劲竞争对手吗?

英伟达的 Project Digits 有潜力成为训练推理一体机的强劲竞争对手,以下是具体分析:

性能优势

强大的计算能力 :Project Digits 搭载 NVIDIA GB10 Grace Blackwell 超级芯片,可提供 1 PFLOPS 的 FP4 AI 计算性能,能够轻松运行超过 2000 亿参数的大语言模型,通过叠加两台 Project Digits,可支持处理参数高达 4050 亿的大语言模型,这使其在处理复杂的 AI 训练和推理任务时具有显著优势。

高效的数据处理 :配备 128GB LPDDR5X 内存和 4TB NVMe SSD,以及先进的 DRAM 芯片和 NAND 存储技术,提高了数据的传输速度和读取写入速度,在处理数据密集型的 AI 计算任务时表现出色。

成本效益

降低云端费用 :在本地提供强大的计算能力,削减了经常性的云端费用,对于处理大型数据集的团队和初创公司、研究团队来说非常理想。

一次性投资 :相比传统的基于云端的人工智能服务,Project Digits 只需一次性投资,无需持续的订阅费用或隐藏费用。

软件环境

预装操作系统和工具 :搭载基于 Ubuntu 22.04 的 Linux 操作系统 DGX OS,预装了完整的 AI 开发工具链,包括 SDK、编排工具、PyTorch 等 AI 框架,以及来自 NVIDIA NGC 目录的预训练模型和资源库,开发者无需进行复杂的配置即可开始工作。

优化的 AI 软件 :包含多项优化、附加驱动及诊断 / 监控工具,如 NVIDIA NeMo 框架和 RAPIDS 库等,助力开发者将工作部署至云端和数据中心。

应用场景

AI 开发与研究 :为 AI 开发者和研究人员提供了一个高性能的计算平台,能够加速 AI 模型的训练、微调和测试过程,缩短开发周期,提高研发效率。

企业级应用 :适用于企业级的 AI 应用场景,如数据分析、预测建模、智能客服等,能够帮助企业快速构建和部署 AI 解决方案,提升业务竞争力。

教育领域 :在教育领域,可用于教学智能化、个性化评估等场景,为教育工作者和学生提供更高效的教学和学习工具。

局限性

市场认知度相对较低 :相比一些传统的训练推理一体机品牌,Project Digits 的市场认知度和品牌影响力还有待提高,可能会影响其在市场上的推广和应用。

生态系统的完善程度 :虽然 Project Digits 搭载了丰富的 AI 开发工具和预训练模型,但其生态系统的完善程度可能不如一些成熟的训练推理一体机平台,例如在特定行业应用的解决方案和工具支持方面可能相对较少。

应用场景的局限性 :Project Digits 主要针对 AI 开发和研究场景设计,对于一些非 AI 领域的应用场景可能不太适用,而一些训练推理一体机则具有更广泛的应用场景和通用性。

市场竞争

竞争对手 :训练推理一体机市场上存在众多竞争对手,如谷歌、微软、亚马逊等科技巨头,以及联想、新华三等硬件厂商,这些企业都拥有强大的技术实力和市场份额,Project Digits 需要在激烈的市场竞争中脱颖而出。

市场趋势 :随着 AI 技术的不断发展和应用场景的拓展,训练推理一体机市场呈现出快速增长的趋势,但同时也面临着技术更新换代快、用户需求多样化等挑战,Project Digits 需要不断跟进市场趋势,提升产品性能和功能,以满足用户的需求。

综上所述,英伟达的 Project Digits 凭借其强大的性能、成本效益和便捷的软件环境,在训练推理一体机市场上具有一定的竞争优势,但同时也面临着市场认知度、生态系统和应用场景等方面的挑战。未来,随着技术的不断进步和市场的不断变化,Project Digits 有望成为训练推理一体机市场的重要参与者之一。

淳中科技成为Project Digits重要经销商在国内训练及推理一体机市场的开拓策略与前景研究

在数字化与智能化飞速发展的当下,人工智能(AI)技术成为推动各行业变革与进步的核心力量。训练及推理一体机作为 AI 技术实现的关键硬件设备,在科研、企业数字化转型、智能安防等众多领域展现出不可或缺的价值,其市场需求呈现出迅猛增长的态势。根据市场研究机构的数据,过去几年全球训练及推理一体机市场规模以每年超过 20% 的速度增长,预计在未来几年仍将保持强劲的增长势头。

淳中科技作为行业内的知名企业,在专业视音频显控领域拥有深厚的技术积累和丰富的市场经验。公司长期服务于政府、军队、公安、交通、金融、能源、大型企业等社会各类客户,构建了庞大且稳定的客户网络。这些客户在数字化转型和智能化升级过程中,对训练及推理一体机存在潜在的强烈需求,为淳中科技开拓新市场提供了得天独厚的客户资源基础。

与此同时,淳中科技与全球图形技术和人工智能计算领域的领导者英伟达建立了紧密的合作关系。英伟达在 AI 芯片及相关技术方面的卓越成就,使其成为训练及推理一体机核心组件的主要供应商。而这次英伟达最新推出的Project Digits将有望成为淳中科技与英伟达的合作又一个最新旗舰项目,将使淳中科技不仅能够获取先进的技术支持和优质的硬件资源,更能够借助英伟达的品牌影响力和市场渠道,加速自身在训练及推理一体机市场的布局与发展。

0 阅读:0
冷谈哥

冷谈哥

感谢大家的关注