人类每天要做出近 35,000 个决定,从过马路是否安全到午餐吃什么。每个决定都涉及权衡各种选择、回忆过去类似的情景,并对正确的选择有充分的信心。看似仓促的决定实际上来自于从周围环境中收集的证据。而且,同一个人在不同时间对相同情景做出的决定往往不同。
神经网络则相反,每次都做出相同的决定。现在,佐治亚理工学院副教授 Dobromir Rahnev 实验室的研究人员正在训练它们做出更像人类的决策。研究人员表示,这种人类决策科学才刚刚应用于机器学习,但开发更接近实际人脑的神经网络可能会使其更加可靠。
在《自然人类行为》杂志的一篇论文《神经网络 RTNet 展现人类感知决策的特征》中,心理学学院的一个团队展示了一种经过训练可以做出类似人类决策的新型神经网络。
解码决策
“神经网络在做出决定时不会告诉你它们是否对自己的决定有信心,”在佐治亚理工学院获得心理学博士学位的 Farshad Rafiei 说道。“这是与人类决策方式的本质区别之一。”
例如,大型语言模型 (LLM) 容易产生幻觉。当 LLM 被问到一个它不知道答案的问题时,它会编造一些东西而不承认这是假的。相比之下,大多数处于相同情况的人类都会承认他们不知道答案。构建更像人类的神经网络可以防止这种重复,并得出更准确的答案。
制作模型
该团队使用来自著名计算机科学数据集 MNIST 的手写数字训练了他们的神经网络,并要求它解读每个数字。为了确定模型的准确性,他们使用原始数据集运行该模型,然后在数字中添加噪音,使人类更难辨别。为了将模型性能与人类进行比较,他们在没有噪音的原始 MNIST 数据集上训练了他们的模型(以及其他三个模型:CNet、BLNet 和 MSDNet),但在实验中使用的有噪音版本上对它们进行了测试,并比较了两个数据集的结果。
研究人员的模型依赖于两个关键组件:贝叶斯神经网络 (BNN),它使用概率来做出决策;以及证据积累过程,它跟踪每个选择的证据。BNN 每次产生的响应略有不同。随着它收集更多的证据,积累过程有时会偏向一个选择,有时会偏向另一个选择。一旦有足够的证据来做决定,RTNet 就会停止积累过程并做出决定。
研究人员还对模型的决策速度进行了计时,以了解它是否遵循一种名为“速度-准确度权衡”的心理现象,该现象表明,当人类必须快速做出决策时,准确性会降低。
获得模型结果后,研究人员将其与人类的结果进行比较。60 名佐治亚理工学院的学生查看了相同的数据集并分享了他们对决策的信心,研究人员发现人类和神经网络的准确率、响应时间和信心模式相似。
“一般来说,现有的计算机科学文献中没有足够的人类数据,所以我们不知道人们在接触这些图像时会如何表现。这种限制阻碍了准确复制人类决策的模型的开发,”拉菲埃说。“这项研究提供了人类对 MNIST 反应的最大数据集之一。”
该团队的模型不仅优于所有竞争对手的确定性模型,而且由于人类心理学的另一个基本要素,它在高速场景中也更准确:RTNet 的行为与人类相似。例如,当人们做出正确的决定时,他们会感到更自信。Rafiei 指出,甚至无需专门训练模型来支持信心,模型就会自动应用它。
他说:“如果我们尝试让我们的模型更接近人类大脑,它将在行为本身中表现出来而无需进行微调。”
研究团队希望在更多不同的数据集上训练神经网络,以测试其潜力。他们还希望将这个 BNN 模型应用于其他神经网络,使它们能够更像人类一样进行合理化。最终,算法不仅能够模拟我们的决策能力,甚至可以帮助减轻我们每天做出的 35,000 个决策的部分认知负担。