面向未来的算力网络连接发展特点与实践AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新英伟达隆重宣布新一代B
LLM训练性能基准测试(昇腾910B3)随着 ChatGPT 的火爆,AI 大模型时代已经到来。然而,这也导致了 AI
2024中国服务器CPU行业概览:信创带动服务器CPU国产化AA体系是一种基于ARM指令系统和Android操作系统的体
面向超万卡集群的新型智算技术白皮书超万卡集群将有助于压缩大模型训练时间,实现模型能力的快速迭代,并及时对市场趋势作出应对
2024中国空间计算产业链拆解空间计算设备主要包括AR、VR、MR等终端设备。VR设备通常包括头戴式显示器(VR头盔)、
2024 半导体分析洞察:AI 硬件基础设施篇一、引言随着人工智能(AI)技术的飞速发展,AI 硬件基础设施在整个 AI
CPU行业概览:信创带动服务器CPU国产化目前CPU行业由两大生态体系主导:一是基于X86指令系统和Windows操作系
AI 大模型算力芯片产业深度分析算力需求爆发拉动芯片量价齐升ChatGPT,由OpenAI推出的全球热门对话AI模型,自
AI 网络,为什么需要RDMA?在2022年前,RDMA的主要应用领域是高性能计算(HPC)。那时,大部分HPC建设的重
Infiniband格局寡头,性能占优这篇文章探讨了网络交换机的性能优势,以及如何通过扩大模型参数量来提高语言模型的生成
AMD Zen 5架构深入研究在Zen 5技术日上,AMD隆重推出了其最新锐龙9000系列—“Granite Ridge
ARM V2处理器微架构介绍简介ARM V2的微架构是ARM处理器的基础,它包括了指令集、寄存器、控制单元等。这篇文章主
CPU 虚拟化CPU虚拟化基础知识CPU虚拟化是一种技术,它允许多个操作系统在同一个物理CPU上运行。这种技术可以提高计
GPU 和 GPGPU 有啥区别?1、GPU随着图形处理相关计算需求的不断增加,CPU本身在浮点计算能力上的限制,对于需
英伟达的 DGX SuperPOD 是一台完整的数据中心级 AI 超级计算机,采用模块化的设计,支持不同规模大小的设计。
GPT-4o mini发布,轻量级大模型如何颠覆AI的未来?引言随着人工智能技术的飞速发展,大型AI模型的发布已成常态。
字节跳动:大模型网络实践分享自2019年起,字节跳动公司便开始着手白盒项目。2020年,推出了首款接入交换机——25G型
存储 IO 性能优化策略、方案与瓶颈分析(15张图)存储IO性能优化是难题,因为它通常涉及全局性问题,需要从应用、数据库
并发高负载场景下,负载均衡优化技术负载均衡是一种计算机技术,主要用于在多个计算机(如计算机集群)、网络连接、CPU、硬盘
彻底理解系列之:FP32、FP16、TF32、BF16、混合精度随着大模型的涌现,训练和推理速度成为关键。为提升速度,需
签名:薪科技评说,发现技术的点滴,记录科学的飞跃!