IBM发布Telum II处理器,这是一款为下一代IBM Z大型机内置AI加速器的处理器,能够同时处理关键任务和AI工作负载。IBM表示,与2021年发布的原始Telum相比,这款新处理器在关键系统组件上的潜在性能提升高达70%。
Telum II处理器采用三星的5HPP工艺制造,包含430亿个晶体管,集成8个高性能核心,这些核心在分支预测、存储写回和地址转换方面进行了改进,运行频率达到5.5GHz,并且拥有36MB的L2缓存,比前一代产品增加了40%。此外,CPU还支持扩展到360MB和2.88GB的虚拟L3和L4缓存。
Telum II的关键特性之一是其改进的AI加速器,计算能力是前代产品的4倍,能够达到每秒24万亿次操作(TOPS)的INT8精度。加速器的架构针对实时处理AI工作负载进行了优化,以实现低延迟。此外,Telum II还内置了DPU,以加快交易处理速度。
Telum II处理器的系统级优化确保了处理器每个机柜中的AI加速器能够从任意8个核心中的任意一个接收任务,这不仅平衡了工作负载,而且在所有加速器配置完备时,每个机柜的AI处理能力可达到192 TOPS的峰值。
除了Telum II,IBM还推出了与IBM Research合作开发的新型Spyre AI加速卡,包含32个AI加速器核心,与Telum II中的AI加速器在架构上具有相似性。Spyre Accelerator可以通过PCIe连接集成到IBM Z的I/O子系统中,以增强系统的AI处理能力。Spyre包含260亿个晶体管,采用三星5LPE工艺制造。
Telum II处理器和Spyre Accelerator都旨在支持集成AI方法,这种方法涉及使用多个AI模型来提高任务的准确性和性能。IBM举例说,这在欺诈检测中很有用,将传统的神经网络与大型语言模型(LLMs)结合起来,可以显著提高可疑活动的检测能力。
Telum II处理器和Spyre Accelerator预计将在2025年上市。