如果人工智能可以告诉你,你何时死亡

物理数字与科技 2024-02-07 14:51:22

(本文转译自scientificamerican.com)

听起来像是幻想或小说,但人们经常在预测未来。现实世界中的预言家,我们称之为精算师和气象学家,多年来成功地使用计算机模型。而如今机器学习的快速进步正在迅速提升他们的数字水晶球。根据最近在《自然计算科学》杂志上发表的一项研究,一种将人类生命看待为语言的新型人工智能系统可能能够准确猜测你是否会在一定时间内去世,以及其他生活细节。

研究团队开发了一种名为life2vec的机器学习模型,可以对人们的生活细节和轨迹进行普遍预测,例如与死亡、国际搬迁和个性特征相关的预测。该模型利用丹麦数百万居民的数据,包括出生日期、性别、就业状况、居住地和对该国的全民医疗保健系统的使用情况。研究指标发现,在研究人群中,在为期四年的时间内,新模型在预测死亡率方面的准确率超过78%,并且明显优于其他预测方法,如精算表和各种机器学习工具。在另一项独立测试中,根据一个研究指标,life2vec还以约73%的准确率预测人们在同一时期是否会搬离丹麦。研究人员还进一步使用life2vec预测人们对个性问卷的自我报告答案,并发现了有关模型能够将个性特征与生活事件联系起来的有希望的初步迹象。

这项研究展示了一种令人兴奋的新方法,可以预测和分析人们生活的轨迹,普林斯顿大学社会学教授、计算社会科学研究者、《Bit by Bit: Social Research in the Digital Age》一书的作者Matthew Sarganik表示。他说,life2vec的开发者们“采用了一种非常不同的风格,据我所知,之前没有人使用过。”

这个新工具的工作方式非常特殊。有很多不同类型的机器学习模型,具有不同的基础架构,被认为在不同的目的上有用。例如,有些模型可以帮助机器人解读摄像头输入,还有些可以帮助计算机生成图像。Life2vec基于与OpenAI的ChatGPT和Google的Bard等流行人工智能聊天机器人相同的架构类型。具体来说,这个新的预测模型最接近于BERT,这是Google在2018年推出的一种语言模型。研究的作者、丹麦技术大学的网络与复杂科学教授Sune Lehmann说:“我们采用了一种已经为语言建模开发出来的原则...然后将其应用于一些关于人类的非常、非常、非常有趣的序列数据。”

为了让语言处理工具对人们的未来进行预测,Lehmann和他的同事们将个体的数据处理成了独特的时间线,由诸如薪资变动和住院等事件组成,具体的事件以数字“标记”表示,计算机可以识别。由于他们的训练数据涵盖了人们的很多信息,而且模型的架构非常灵活,研究人员认为life2vec可以提供一个基础,可以轻松调整和优化,以预测人类生活中许多尚未探索的方面。

Lehmann表示,医疗专业人士已经联系他,希望他们能够帮助开发与健康相关的life2vec版本,比如可以帮助揭示罕见疾病的人群级别风险因素。他希望利用这个工具来发现世界与人类生活结果之间以前未知的关系,可能探索的问题包括“你的人际关系如何影响你的生活质量?”和“决定薪水或早逝的最重要因素是什么?”这个工具还可以揭示隐藏的社会偏见,比如一个人的职业发展与年龄或出生国家之间的意外联系。

然而,目前存在一些严重的限制。Lehmann指出,该模型的数据是特定于丹麦的。而且使用的信息仍然存在许多空缺。尽管广泛,但它并不能捕捉到与一个人的死亡风险或生活轨迹有关的所有内容,Lehmann指出,有些人群很少有详细的健康和就业记录。

最大的限制之一是研究的准确度衡量标准可能不够稳健。多个消息源表示,这些标准更多是概念验证,而不是证明life2vec能够准确预测一个给定人在给定时间段内是否会死亡。

查看研究的统计分析,杜克-玛戈利斯健康政策中心数字健康研究主任Christina Silcox表示,她对于life2vec的个体四年死亡预测并不十分看好。“我不会因为这个而辞职去巴哈马。”她说道,并指出这并不是对Lehmann和他的合著者方法的批评,而是生活结果预测领域固有的限制。

Salganik表示,很难确定如何评估这样的工具的准确性,因为没有其他类似的工具可供比较。个体死亡特别难以评估,因为虽然每个人最终都会死亡,但大多数年轻和中年人每年都能幸存下来。在研究中涵盖的65岁以下年龄群体中,死亡是一个相对不常见的事件。如果你仅仅猜测在35岁至65岁的丹麦人群中的每个人每年都能幸存,那么你已经有一个相当准确的死亡预测了。根据研究,life2vec的表现比这个空白猜测要好得多,但Salganik说很难确定它与现实相比的准确程度。

加州大学圣巴巴拉分校统计与应用概率学教授Michael Ludkovsky也表示赞同。“我很难解释这些结果真正意味着什么。”他说道。他的大部分工作都是在精算科学领域,即风险预测。他表示,life2vec的结果“用一种不同于精算师的语言进行描述”。例如,精算预测会给出一个风险评分,而不是一个二元的死亡或非死亡的预测。 Ludkovsky指出,这些风险评分会考虑到不确定性,而这是life2vec没有考虑到的。

Silcox还指出,还存在重大的伦理考虑。如果错误应用,这样的工具显然会造成伤害。算法偏见是一个真正的风险,“人工智能工具需要对它们试图解决的问题进行非常具体的测试。”她说道。对于每一种新的使用情况,彻底评估life2vec是至关重要的,并且需要不断监测常见缺陷,比如数据漂移——即过去在训练数据中反映的条件不再适用(例如重要的医学进展之后)。

研究人员承认他们已经涉足了一个棘手的领域。他们的研究强调了丹麦在隐私保护和反歧视法律方面的强大保护。学者、政府机构和其他研究人员获得life2vec的访问权后,必须确保数据不会泄露或被用于非科学目的。“在自动个体决策、个人画像或访问个体级数据方面,严格禁止使用life2vec。”作者在论文中写道。

然而,Lehmann补充说,同样具有侵入性和强大的机器学习工具很可能已经存在。其中一些工具甚至接近菲利普·迪克(Philip K. Dick)1956年的中篇小说《少数派报告》(The Minority Report)(以及基于它的2002年的科幻大片)中描述的反乌托邦概念。“在美国,许多法院使用算法工具做出判决。执法机构使用预测警务软件决定如何分配警员和资源。甚至国税局都依赖机器学习来进行审计。在所有这些例子中,偏见和不准确性一直是反复出现的问题。”

在私人领域,科技公司利用先进的算法预测和他们收集的大量关于用户的数据,来预测消费者行为并最大化参与时间。但是,政府和企业工具的确切细节都被保密。

Lehmann表示,通过创建一个可供学术研究人员访问的强大的人工智能预测工具,他希望在已经开始的预测时代促进透明度和理解。“我们可以开始讨论它,我们可以开始决定我们想要如何使用它:什么是可能的,什么是正确的,什么是我们应该不去碰的。”他说。

Lehmann补充说:“我希望这可以成为一场讨论的一部分,帮助我们朝着乌托邦的方向发展,远离反乌托邦。”

0 阅读:0
物理数字与科技

物理数字与科技

感谢大家的关注