IBM已经使用光纤连接处理器这将使人工智能的训练速度提高80倍

探索点小小科技 2024-12-19 00:46:32
IBM 已经使用光纤连接处理器 这将使人工智能的训练速度提高 80 倍

在过去的 20 年里,计算和通信已经转向光接口。这已经发生在主干链路上,但在数据中心以及计算机的芯片、芯片和芯片级别仍然停滞不前。理想情况下,信号应立即以光脉冲的形式从处理器发出,然后发送到隔壁的芯片,或相邻的机架、大厅,甚至更远的地方。IBM 选择了这条路。

用于在芯片上安装外部光 “电缆” 的 CPO 插槽。图片来源:IBM

与铜(导电连接)相比,光学器件具有重量轻、成本低、干扰(干扰)、传输速度快、能耗低等优点,并且通常允许您在不增加功耗的情况下增加带宽。使用光通信线路的能力已经内置于所有最新的以太网标准以及 PCIe 标准中。英特尔曾一度最接近使用 Light Peak 平台将光线路集成到处理器(加速器)中。尽管英特尔早已缩减了该平台的开发,但这个想法并没有消亡,今天在新的光学接口英特尔 OCI(开放计算项目互连链路)中找到了延续。

今天,轮到 IBM 宣布在将光接口集成到处理器的方向上取得突破。与英特尔一样,IBM 的集成光学器件也起源于硅光子学,这两家公司都在 20 多年前开始。IBM 的新集成接口称为共封装光学器件 (CPO)。从字面上看,这翻译为“共包装”或“组合”光学器件 - 一个额外的数据传输通道。它不取代主板上的布线以及计算机内部和机架之间的电缆,而是以高速和节能的接口作为补充。

作为 CPO 接口的光导体,选择了一种廉价的聚合物光波导 (PWG) 光纤。该公司已经提交了厚度为 50 μm 的 PWG 光纤接口(平台)的工作原型,并准备将其缩放为厚度小于 20 μm 的光纤。CPO 接口规范允许在芯片、电路板和机架之间交换数据,或者更简单地说,在几厘米到几百米的距离内运行。

如果 IBM 的解决方案在行业中得到应用和理解,它将通过将功耗降低到中档电气连接功耗的五倍以上,同时将数据中心的互连电缆长度从一米增加到数百米,从而降低扩展生成式 AI 平台的成本。

我们还可以期待加速 AI 模型的训练,这将使开发人员能够以比使用传统有线接口快五倍的速度训练大型语言模型 (LLM)。CPO 技术可以将学习标准 LLM 所需的时间从三个月缩短到三周。它还将通过使用更大的模型和更多的 GPU 来提升性能,从而减少硬件停机时间。

最后,CPO 技术将显著提高数据中心的能源效率,节省的能源相当于每次 AI 模型训练每年消耗 5,000 个美国家庭的能源。

«由于生成式 AI 需要更多的能源和计算资源,数据中心需要发展,而组合光学可以使它们更加面向未来,“IBM 高级副总裁兼首席研究官 Dario Gil 说。“凭借这一突破,未来的芯片将以与光纤电缆在数据中心之间传输信息相同的方式传输数据,从而开创一个更快、更具弹性的通信新时代,可以处理未来的 AI 工作负载。”

IBM 研究人员在 arXiv.org 网站上发表的一篇文章中列出了有关新界面的详细信息。与电气连接相比,新的高带宽密度光学结构与单个光通道上的多个波长传输相结合,可能会将芯片之间的带宽增加多达 80 倍。

IBM 光接口测试

实验平台已通过生产所需的所有压力测试。这些组件暴露在 −40 °C 至 +125 °C 的高湿度和温度范围内,并进行了机械强度测试,以确认光学连接可以弯曲而不会损坏或丢失数据。此外,研究人员还展示了以 18 μm 为增量的 PWG 技术。将四个 PWG 单元与此步骤组合起来,将允许您连接多达 128 个通道。最终,这将提供高达 10 Tbit/mm² 的传输密度。

1 阅读:20

探索点小小科技

简介:感谢大家的关注