2024年4月8日,诺贝尔物理学奖授予约翰·霍普菲尔德和杰弗里·辛顿,以表彰他们在利用人工神经网络进行机器学习方面的奠基性发现和发明。这一消息在物理学界引发了不小的震动。
辛顿作为广为人知的“AI教父”,早在2018年就获得了图灵奖,被公认为数学或计算机专家。此次获奖,连辛顿本人也表示完全出乎意料。
许多人质疑2024年的诺贝尔物理学奖是否颁发错了,这两位科学家发明的人工神经网络和深度学习能否算作物理学?甚至有人猜测,AI是否已经深入人类社会,干扰了此次诺奖的评选。
人工神经网络与物理学的密切联系实际上,人工神经网络的建立与物理学密不可分。首先,两位获奖科学家都拥有物理学背景。
霍普菲尔德于1958年在美国康奈尔大学获得物理学博士学位,之后在贝尔实验室理论组工作,并在加州大学伯克利分校和普林斯顿大学从事物理学研究。虽然在加州理工学院期间开创了计算和神经网络的研究方向,但他与贝尔实验室——这个科技创意工厂——保持了长达35年的密切联系。
贝尔实验室多年来发明了晶体管、激光器、太阳能电池、发光二极管等,40年来诞生了至少10位诺贝尔物理学奖得主。辛顿则出身于科学世家,家族中有多位著名的数学家、文学家、化学家和物理学家。他对物理学、生物学、心理学都感兴趣,并于1972年在苏格兰爱丁堡大学攻读神经网络相关的博士学位。
其次,人工神经网络和机器学习的最早算法雏形借鉴了物理学的思想。霍普菲尔德在思考神经网络工作模式时,想到了物理学中一个经典模型——伊辛模型。
伊辛模型最初用于描述磁性相变的物理过程,该模型将原子晶格中的每个格点赋予自旋向上或向下两种状态,只有相邻格点之间才会相互影响。原子自旋方向的选择取决于其相邻原子的自旋方向,而两个原子之间自旋的平行或反平行关系取决于它们之间的耦合模式,并决定了整个系统的整体能量。
在足够低的温度下,原子自旋会自发选择倾向于最低能量基态的排列方式,最终要么全部同向(铁磁排列),要么互相反向(反铁磁排列)。
霍普菲尔德认识到,大脑的学习和记忆是通过改变神经元之间的连接强度来实现的,这种连接强度类似于伊辛模型中两个原子之间的关联强度,要么被加强,要么被减弱,最终决定了系统的整体能量大小。如果预先给一个二维网络的每个格点赋值以存储记忆,那么面对一组新的输入数据时,需要判断这些数据是否提升或降低了系统能量,这取决于格点之间的连接是否发生了变化。
系统会遍历所有格点,找到一个最合适的组合,即能量最低的路径,尽可能还原之前的图像,从而使神经网络具备记忆和自我学习的功能。霍普菲尔德的模型虽然简单,却十分有效,就像在一个由大小不一的凹坑组成的景观中放置一个小球,小球会自动搜索最佳路径,落入预先选定的凹坑中。
辛顿则借鉴了统计物理学的思想,对霍普菲尔德的网络进行了进一步发展,建立了一套概率判断的方法。系统会自动获知不同状态能量对应的概率,并最终选择概率最大的可能性进行输出。
他的方法被称为玻尔兹曼机,其名称来源于著名的统计物理学家玻尔兹曼。玻尔兹曼找到了微观粒子运动与热力学之间的关系,并建立了理想气体分子的玻尔兹曼统计方程。
简单来说,玻尔兹曼模型忽略了气体分子之间复杂的相互作用,以气体分子的速度(对应于经典物理学中的动能)来建立粒子数目分布的方程,即粒子的能量大小决定了它出现的概率。虽然玻尔兹曼机是一个经典物理模型,但它极大地推进了机器学习的发展,甚至能够通过样本学习创造出全新的模式。
人工智能的未来与物理学的交融虽然现在的大模型算法已经不再是辛顿等人当年的框架,但霍普菲尔德网络和玻尔兹曼机是人工神经网络迈向实用化的关键一步。如今,人工智能已经彻底改变了科学研究的基本范式,即使在基础物理领域,AI的应用也十分普遍,例如粒子物理学家用它来分析对撞机的数据,天文学家用它来解析黑洞的照片,凝聚态物理学家用它来预测材料结构和物性等。
除了理论、实验、计算这科研“三板斧”之外,现在又有了AI的助力。即使在科学理论不完备的情况下,AI也能根据实验数据结果和计算模拟结果来预测新的物理现象。
“AI for science”有望成为科学研究的第四范式,激发更多原始创新和技术发明,推动人类社会进步。