PoX可能是解决人工智能硬件中存储限制造成的性能瓶颈的关键。
复旦大学的一个研究小组制造了迄今为止最快的半导体存储设备,一种被称为“PoX”的非易失性闪存,可以在400皮秒(0.0000000004秒)内对单个比特进行编程,大约每秒250亿次操作。今天发表在《自然》杂志上的研究结果,将非易失性存储器推向了以前为最快易失性内存保留的速度域,并为数据密集型人工智能硬件设定了基准。
打破速度上限
传统的静态和动态RAM(SRAM、DRAM)在1-10纳秒内写入数据,但在断电时会丢失所有数据。相比之下,闪存芯片在没有电源的情况下保存数据,但每次写入通常需要微到毫秒的时间——对于实时分流TB参数的现代人工智能加速器来说太慢了。
由集成芯片与系统国家重点实验室周鹏教授领导的复旦小组,通过用二维狄拉克石墨烯取代硅通道并利用其弹道电荷传输,重新设计了闪存物理。
通过调整通道的“高斯长度”,该团队实现了二维超级注入,这是一种有效的无限电荷涌进存储层,绕过了传统的注入瓶颈。
“利用人工智能驱动的工艺优化,我们将非易失性存储器推向了理论极限,”周教授告诉媒体,并补充说这一壮举“为未来的高速闪存铺平了道路。”
一眨眼10亿次
合著者刘春森将这一突破比作从每秒写入1000次的U盘转变为一眨眼就能触发10亿次的芯片。此前非易失性闪存编程速度的世界纪录是每秒约200万次操作。
由于PoX是非易失性的,因此它可以在没有备用电源的情况下保留数据,这是下一代边缘AI和电池受限系统的关键特性。将超低能量与皮秒写入速度相结合,可以消除人工智能推理和训练硬件中长期存在的内存瓶颈,在这些硬件中,数据传输而不是算术现在主导着功耗预算。
工业及策略影响
由于其成本和可扩展性,闪存仍然是全球半导体战略的基石。评论家们说,复旦大学的进展提供了一种“完全原创的机制”,可能会破坏这种格局。
如果大规模生产,PoX类型的存储器可以消除人工智能芯片中单独的高速SRAM缓存,从而节省面积和能源。它可以启用即时启动、低功耗的笔记本电脑和手机,并支持在持久内存中保存整个工作集的数据库引擎。
该设备还可以加强中国国内确保在基础芯片技术领域领先地位的努力。该团队没有透露耐用性数据或制造产量,但石墨烯通道表明与全球晶圆厂已经在探索的现有2D材料工艺的兼容性。“我们的突破可以重塑存储技术,推动产业升级,开辟新的应用场景,”周教授说。
接下来会发生什么
复旦大学的工程师们现在正在扩展电池架构,并进行阵列级的演示。商业合作伙伴的名字尚未公布,但中国的晶圆代工厂正在竞相将2D材料与主流CMOS生产线集成。
如果成功的话,PoX将成为一种新型的超快速、超绿色存储器,满足大型语言模型加速器不断膨胀的需求,最终为人工智能硬件提供一种与其逻辑保持同步的存储介质。
如果朋友们喜欢,敬请关注“知新了了”!