AI 网络,为什么需要RDMA?在2022年前,RDMA的主要应用领域是高性能计算(HPC)。那时,大部分HPC建设的重
Infiniband格局寡头,性能占优这篇文章探讨了网络交换机的性能优势,以及如何通过扩大模型参数量来提高语言模型的生成
AMD Zen 5架构深入研究在Zen 5技术日上,AMD隆重推出了其最新锐龙9000系列—“Granite Ridge
ARM V2处理器微架构介绍简介ARM V2的微架构是ARM处理器的基础,它包括了指令集、寄存器、控制单元等。这篇文章主
CPU 虚拟化CPU虚拟化基础知识CPU虚拟化是一种技术,它允许多个操作系统在同一个物理CPU上运行。这种技术可以提高计
GPU 和 GPGPU 有啥区别?1、GPU随着图形处理相关计算需求的不断增加,CPU本身在浮点计算能力上的限制,对于需
英伟达的 DGX SuperPOD 是一台完整的数据中心级 AI 超级计算机,采用模块化的设计,支持不同规模大小的设计。
GPT-4o mini发布,轻量级大模型如何颠覆AI的未来?引言随着人工智能技术的飞速发展,大型AI模型的发布已成常态。
字节跳动:大模型网络实践分享自2019年起,字节跳动公司便开始着手白盒项目。2020年,推出了首款接入交换机——25G型
存储 IO 性能优化策略、方案与瓶颈分析(15张图)存储IO性能优化是难题,因为它通常涉及全局性问题,需要从应用、数据库
并发高负载场景下,负载均衡优化技术负载均衡是一种计算机技术,主要用于在多个计算机(如计算机集群)、网络连接、CPU、硬盘
彻底理解系列之:FP32、FP16、TF32、BF16、混合精度随着大模型的涌现,训练和推理速度成为关键。为提升速度,需
揭秘英伟达H20:核心价值和高效运用的双重解读2023年,ChatGPT的问世引爆了AIGC领域。在这场"百模大战"中,
数字孪生网络 (DTN): 概念、架构及关键技术摘要随着5G商用规模部署和下一代互联网IPv6的深化应用,新一代网络技术
拆解服务器五大关键组件"AI服务器五大硬件揭秘:深入剖析PCB构造,揭示内部真实面貌。本文通过一步步拆解PCB,为读者呈
智算中心算力池化技术深度分析智能算力,人工智能基石,助力构建多要素融合信息基础设施。作为数字经济高质量发展核心引擎,智能
智算中心网络交换机需要什么样的缓存架构?数据中心交换机的缓存大小是一个重要的性能指标。虽然缓存可以提高数据交换的效率,但
数据库性能指标及数据要素构架一、引言在当今数字化时代,金融行业高度依赖信息技术来处理大量的敏感数据和进行复杂的交易操作。
阿里巴巴HPN:用于大型语言模型训练的数据中心网络摘要本文介绍了阿里云用于大型语言模型(LLM)训练的数据中心网络HPN
GPU算力评估一、 关于训练GPU的带宽大模型训练算力需求:总算力(Tlops)=6倍模型参数量×训练数据token量,
签名:薪科技评说,发现技术的点滴,记录科学的飞跃!