Google的Titans:赋予AI人类般的记忆能力
给科技置顶
2025-01-27 01:43:07
七年零七个月前,Google 通过 Transformer 架构改变了世界,这一架构现在已成为 OpenAI 的 ChatGPT 等生成式 AI 应用的核心。
如今,Google 推出了名为 Titans 的新架构,作为 Transformer 的直接进化版本,让我们向着具有人类思维方式的 AI 迈进了一步。
Transformer 架构没有长期记忆能力,这限制了它在较长时间内保留和使用信息的能力 - 而这是人类思维的重要组成部分。Titans 引入了神经长期记忆,以及短期记忆和基于惊喜的学习系统 - 这些都是我们大脑用来记住意外或关键事件的工具。
简单来说,Transformer 有一个类似"聚光灯"的机制 (称为注意力机制),在任何给定时刻只关注句子或数据集中最相关的词或数据点。Titans 仍然使用这种聚光灯机制,但增加了一个巨大的"图书馆" (长期记忆模块) 来存储重要的历史信息。
这就像一个学生可以参考学期早期的笔记,而不是试图一次性记住所有内容。通过结合这两种方法 - 即时注意力焦点和存储知识的深度回忆 - Titans 可以处理海量数据而不会丢失关键细节。
初步基准测试表明,得益于其用于优先处理关键数据点的智能"惊喜度量",Titans 在语言建模、时间序列预测甚至 DNA 建模等各种任务中的表现都优于现有模型。简而言之,Titans 可能标志着 AI 范式转变的开始,让机器智能向人类认知更近一步。
重大意义
Google 的新设计不仅仅是提升性能指标。通过密切模仿人类认知如何优先处理令人惊讶的事件,以及如何在短期和长期尺度上管理信息,Titans 为创建更直观、更灵活的 AI 系统铺平了道路。
这种架构保留广泛上下文的能力可能会彻底改变研究领域,AI 助手可以追踪多年的科学文献。它们可能会更善于发现大型数据集中的异常 - 比如医疗扫描或金融交易 - 因为它们能"记住"什么是正常的,并突出显示意外情况。
从更广泛的层面来看,通过推动 AI 向更人性化的处理方式发展,Titans 可能意味着 AI 能够比人类思考得更深入 - 这挑战了我们对人类独特性及其在 AI 增强世界中角色的理解。
驱动性能的技术创新
Titans 设计的核心是努力更紧密地模拟人脑的功能。虽然之前的 Transformer 等模型引入了注意力概念 - 允许 AI 关注特定的相关信息 - 但 Titans 更进一步。新架构融入了人类认知过程的类似物,包括短期记忆、长期记忆,甚至"遗忘"不太相关信息的能力。也许最有趣的是,Titans 引入了一个颇具人性化的概念:优先处理令人惊讶或意外信息的能力。这模仿了人类更容易记住违反预期事件的倾向,这一特征可能带来更细致和更注重上下文的 AI 系统。
Titans 的关键技术创新是引入了神经长期记忆模块。该组件学习记忆历史上下文,并与现代 AI 模型中标准的注意力机制协同工作。结果是一个在处理数据或生成响应时,可以有效利用即时上下文 (类似短期记忆) 和更广泛历史信息 (长期记忆) 的系统。
这种双重记忆方法使 Titans 克服了当前 Transformer 模型的主要限制之一:固定长度的"上下文窗口",即模型一次可以处理的最大文本或信息量。虽然最先进的模型可以处理多达 200 万个"token" (如单词、数字、标点符号等意义单位)的令人印象深刻的上下文窗口,但 Titans 可以有效地超越这一限制,即使在更大的输入下也能保持高精度。这一突破可能对需要分析超大文档或数据集的任务产生重大影响。
记忆管理的惊喜度量
Titans 最引人入胜的方面之一是其记忆管理方法。系统使用"惊喜"度量来决定哪些信息应该存储在长期记忆中。违反模型预期的事件或数据点在记忆存储中获得优先处理。这不仅反映了人类的认知过程,还为管理 AI 系统有限记忆资源的挑战提供了新颖的解决方案。这种基于惊喜的记忆管理配合考虑记忆大小比例和惊喜数据量的衰减机制。结果是一个更动态和适应性的记忆系统,可以优先处理重要信息,同时逐渐遗忘不太相关的细节 - 很像人类大脑。
超越现有模型
Titans 的早期测试在多个任务中显示出令人期待的结果。在语言建模方面,特别是在需要从大量文本中提取特定信息的任务 (通常称为"大海捞针"任务) 中,Titans 的表现优于现有模型。即使在输入序列长度增加的情况下,其性能仍保持稳定,而其他模型往往会出现准确性急剧下降。除了自然语言处理外,Titans 在时间序列预测甚至 DNA 序列建模方面也表现出令人印象深刻的能力。这种多功能性表明该架构可能在 AI 和机器学习的各个领域都有广泛应用。
挑战与未来方向
虽然 Titans 的初步结果令人鼓舞,但重要的是要注意该技术仍处于早期阶段。与任何新的 AI 架构一样,在实际应用中扩展和实施 Titans 可能会面临挑战。随着技术的成熟,需要解决计算需求、训练效率和潜在偏差等问题。此外,AI 以类似人类的方式保留和优先处理信息的能力可能会引发关于隐私、数据处理和 AI 系统可能产生意外行为的新问题。
结论
Google 的 Titans 架构为更复杂、更注重上下文的 AI 应用开辟了新的可能性。随着该领域研究的继续,我们可能正在见证人工智能新范式的早期阶段 - 这使我们更接近于创造真正智能的系统,能够以更符合人类认知的方式理解和与世界互动。随着 Titans 和类似架构的完善,以及在 AI 等领域的广泛应用,未来几年无疑会带来令人兴奋的发展。
1
阅读:4