聚焦下一代高带宽内存技术Rambus发布业界首款HBM4控制器IP

中关村在线 2024-11-26 07:21:36

近几年来,生成式AI和大模型技术的快速发展拉开了AI时代的序幕。作为当今时代最具变革性的技术之一,人工智能可以通过学习、推理和自我修正等方式实现自主决策和行动,并在医疗保健、金融、交通、教育等领域发挥重要作用。

众所周知,人工智能通常可以分为训练和推理两大主要步骤,在AI的训练阶段,除了需要向AI模型投喂大量优质数据,使其学习即将分析的数据类型的所有信息外,还需要相当长的计算周期,特别是参数较多的AI模型,如实时语言处理翻译的大语言模型以及实时生成式语言模型等,所需的计算周期通常要更长。

一旦AI模型完成了基于大量数据的训练后,就可以将其应用到实际场景中,并对模型此前从未见过的案例进行推理,也就是AI的推理阶段。这一阶段通常对性能有较高的要求,尤其是在推理速度和准确性上。

不难看出,如果训练过程需要的时间越短,就意味着AI模型可以更早投入使用,从而帮助投资者尽早获得回报,并最大化投资回报率。而这也使得计算系统对内存的需求日益增长,例如高性能、小尺寸等等,特别是在推理阶段,往往还需要更短的延迟和更高的带宽,以确保推理结果能够实时快速地给出。

虽然自2012年起,消费电子产品的火热就开始带动内存在速度、容量和尺寸方面的更新迭代,但AI时代对内存的需求则得到了进一步扩大,以大语言模型GPT为例,最早于2022年11月发布的GPT-3是采用1750亿个参数构建的,而在今年5月发布的GPT-4o则使用了超过1.5万亿个参数。在短短两年时间里,模型的规模就增长了410倍,但硬件内存的增长仅为两倍,这也就意味着,要完成这些AI模型的任务,就必须投入额外数量的GPU和AI加速器以满足对内存容量和带宽的需求。

为了应对这一挑战,提升内存带宽与容量就显得至关重要,Rambus研究员兼杰出发明家Steven Woo博士在接受采访时表示,与DDR、LPDDR和GDDR相比,具备高带宽和高密度的HBM高性能内存正是AI训练、高性能计算和网络应用等场景下的最佳选择。

从结构上来看,HBM中的DRAM内存会首先通过中介层的物理线与处理器相连,然后再将上述组件一起连接到基板上,并最终焊接在PCB上。由于HBM的DRAM堆栈会使用多层堆叠的架构,且单独的内存晶片都实现了和处理器的直接相连,使得HBM能够在紧凑的空间内提供极高的内存带宽、大容量、高能效和低延迟。

如今,HBM已经成为AI训练硬件中不可或缺的技术,从第一代HBM在到如今非常流行的HBM3,每一代最明显的变化就是单个堆栈带宽的急剧增加,目前HBM3的单个堆栈带宽已经达到了819GB/s,而由SK海力士、美光和三星共同发布的HBM3E数据传输速率最高达到了9.6Gb/s,单个堆栈带宽则达到了1229GB/s。

在高带宽内存需求的推动下,由JEDEC制定的下一代内存技术标准HBM4的单个堆栈带宽有望达到1.6TB/s或更高,这就意味着HBM4内存最终达到的实际带宽可能要更高。

为了帮助处理器厂商和开发人员更轻松地集成和使用HBM4内存,在内存系统领域拥有超过30年高性能内存系统开发和研究经验的Rambus于近日宣布推出业界首款HBM4控制器IP,旨在加速下一代AI工作负载,可适用于包括AI加速器、图形处理器和高性能计算应用在内的一系列先进处理器。

Steven Woo博士表示,基于HBM4内存解决方案在性能方面的进一步提升,HBM4控制器IP提供了32个独立通道接口,总数据宽度达到了2048位,在此基础上,当数据速率为6.4Gbps时,HBM4的总内存吞吐量就会比HBM3高出两倍以上,达到1.64TB/s的水平。

与此前Rambus推出的HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案,针对客户在不同应用场景中的独特需求,Rambus还提供了定制化服务,涵盖尺寸、性能和功能等方面,关键可选功能包括ECC、RMW和错误清理等,此外,为了确保客户能够根据需要选择各种第三方PHY并应用于系统中,Rambus还和领先的PHY供应商展开了合作,确保客户在开发过程中能够一次流片成功。

值得一提的是,随着传输速率和带宽的提升,HBM4在设计层面也面临着不少挑战,例如确保内存控制器不会影响附近的电路、确保内存控制器与PHY互操作性的前提下与其余部分实现集成、确保时序收敛以及确保处理器中的信号准确移动等等,Steven Woo博士表示,Rambus花费了大量时间来确保控制器的兼容性,并能够实现快速集成和首次硅片成功,这些都是基于Rambus在内存领域的长期技术耕耘。

截至目前,Rambus在HBM市场上的份额已经位居第一,并成功完成了超过100次的HBM设计,在产品交付方面,Rambus成功交付了业界领先的HBM3E内存控制器以及业界最高传输速率的HBM2E内存控制器,速率可达每秒4Gbps。

为了帮助客户实现一次流片成功,Rambus还提供了三方面的支持,具体来说,在控制器测试平台方面,用户可以通过该测试平台执行完整的控制器代码库的回归测试,针对客户需要的在控制器上进行的测试,Rambus同样提供了非常广泛的测试序列,客户可以执行特定控制器和PHY的广泛测试序列,此外Rambus也推出了基于功能覆盖率的验证计划,从而确保完整性。

在验证IP方面,Rambus与西门子旗下的子公司Avery Design Systems达成了长期合作,可提供多种BFM,包括内存模块BFM、主机内存控制器BFM和PHYBFM。

最后在PHY支持方面,Rambus为各种第三方PHY提供了广泛支持,控制器可以与各种第三方PHY进行匹配、认证和验证,从而确保客户在使用控制器时能与第三方PHY实现轻松集成。

除了在HBM4控制器上有着技术领先,对客户而言,最重要的是Rambus可以提供丰富的半导体IP解决方案组合,可以广泛应用于各种AI应用、高性能计算和先进处理等场景。

具体来看,在接口IP产品组合方面,Rambus可以提供一整套高性能内存控制器解决方案,涵盖HBM、GDDR、LPDDR和DDR内存,这些控制器支持PCIe、CXL、MIPI等主流高速互联协议。例如针对显示应用,Rambus提供了支持无损视频压缩和前向纠错的解决方案。这些解决方案可以在当前的接口技术下提供最高的分辨率和帧率。

不但如此,Rambus还能提供业内最为广泛的安全IP产品组合,这些IP产品组合涵盖了高性能芯片和处理器解决方案的核心构建模块,包括HBM和GDDR内存控制器、PCIe和CXL协议控制器,以及后量子密码学、Root of Trust和加密等安全功能。

“为了进一步确保数据的安全性,我们还提供内存内加密(IMI)解决方案,以保护数据在加速器和内存之间传输时的安全。此外,Rambus也提供了针对PCIe和CXL连接处理器时的数据完整性和加密功能,以确保数据在链路中的传输安全。同时,Rambus的信任根IP也能通过安全启动、数字标识和认证签名等功能保护硬件和数据安全,并提供其他的加密服务。”Steven Woo博士在最后表示。

(9219010)

0 阅读:1