科学家也被替代?新创建的“人工智能科学家”将开始大量研究

知新了了 2024-08-26 11:41:38

科学发现是人类最复杂的活动之一。首先,科学家必须了解现有的知识,并找出一个显著的差距。接下来,他们必须制定一个研究问题,设计并进行实验,以寻求答案。然后,他们必须分析和解释实验结果,这可能会引发另一个研究问题。

这么复杂的过程可以自动化吗?上周,Sakana人工智能实验室宣布创建了一个“人工智能科学家” —— 一个人工智能系统,他们声称,可以在机器学习领域以全自动的方式进行科学发现。

使用像ChatGPT和其他人工智能聊天机器人背后的生成式大型语言模型(LLM),系统可以集思广益,选择一个有前途的想法,编写新算法,绘制结果,并撰写一篇总结实验及其发现的论文,并附有参考文献。

Sakana声称,这种人工智能工具可以承担一项科学实验的整个生命周期,而每篇论文的成本仅为15美元 —— 比科学家一顿午餐的成本还低。

这是一些重要的主张。它们叠起来了吗?即便如此,一群人工智能科学家以非人的速度大量发表研究论文,对科学来说真的是个好消息吗?

计算机如何“做科学”

很多科学研究都是公开进行的,几乎所有的科学知识都被写在某处(否则我们就没有办法“知道”它)。数以百万计的科学论文在arXiv和PubMed等知识库中免费在线提供。

用这些数据训练的LLM掌握了科学语言及其模式。因此,生成LLM能够写出一篇看起来像好的科学论文的东西,也许一点也不奇怪 —— 它已经吸收了许多可以复制的例子。

不太清楚的是,人工智能系统是否能写出一篇有趣的科学论文。至关重要的是,好的科学需要新颖。

但是,它有趣吗?

科学家不想被告知已经知道的事情。相反,他们想要学习新事物,尤其是那些与已知知识明显不同的新事物。这需要对贡献的范围和价值进行判断。

Sakana系统试图通过两种方式解决趣味性问题。首先,它会根据与现有研究的相似度对新论文进行“评分”(在Semantic Scholar知识库中编入索引)。任何太相似的东西都会被丢弃。

其次,Sakana的系统引入了“同行评审”步骤 —— 使用另一位LLM来判断生成论文的质量和新颖性。这里,有很多在线同行评议的例子,比如openreview.net,可以指导如何评论一篇论文。LLM也摄入了这些。

AI可能对AI的输出判断不佳

对于Sakana AI的输出,反馈是混杂的。一些人将其描述为产生“无尽的科学垃圾”。

就连该系统自己对其产出的评估,也认为这些论文充其量只能算是薄弱的。随着技术的发展,这种情况可能会得到改善,但自动化科学论文是否有价值的问题仍然存在。

LLM判断研究质量的能力也是一个悬而未决的问题。一些研究表明,LLM在判断医学研究中的偏倚风险方面并不擅长,尽管这一点也可能随着时间的推移而改善。

Sakana的系统使计算研究中的发现自动化,这比其他需要物理实验的科学要容易得多。Sakana的实验是用代码完成的,这也是LLM可以训练生成的结构化文本。

人工智能工具是为了支持科学家,而不是取代他们

几十年来,人工智能研究人员一直在开发支持科学的系统。鉴于已发表的研究成果数量庞大,即使是找到与特定科学问题相关的出版物也可能具有挑战性。

专门的搜索工具利用人工智能来帮助科学家发现和合成现有的工作。这包括上面提到的Semantic Scholar,也包括较新的系统,如Elicit、Research Rabbit、sciite和Consensus。

文本挖掘工具,如PubTator,更深入地挖掘论文,以确定重点,如特定的基因突变和疾病,以及它们之间的既定关系。这对于管理和组织科学信息特别有用。

机器学习也被用于支持医学证据的合成和分析,如机器人审查器等工具。对Scholarcy论文中的观点进行比较和对比的摘要有助于进行文献综述。

所有这些工具都旨在帮助科学家更有效地完成工作,而不是取代他们。

人工智能研究可能会加剧现有问题

虽然Sakana AI表示,它并不认为人类科学家的作用会减弱,但该公司“完全由人工智能驱动的科学生态系统”的愿景,将对科学产生重大影响。

一个担忧是,如果人工智能生成的论文充斥着科学文献,未来的人工智能系统可能会接受人工智能输出的训练,并经历模型崩溃。这意味着他们在创新方面可能会变得越来越无能。

然而,对科学的影响远远超出了对人工智能科学系统本身的影响。

科学界已经出现了坏人,包括大量生产假论文的“造纸厂”。如果只用15美元就能发表一篇科学论文,而且开头提示很模糊,那么这个问题只会变得更糟。

在堆积如山的自动生成的研究中检查错误的需要,可能会迅速超出实际科学家的能力。同行评议系统可以说已经崩溃了,向系统中倾倒更多质量有问题的研究并不能解决这个问题。

科学的基础是信任。科学家们强调科学过程的完整性,这样我们就可以确信我们对世界(现在是世界上的机器)的理解是有效的,并且在不断改进。

在一个以人工智能系统为关键角色的科学生态系统中,这一过程的意义和价值,以及我们应该对人工智能科学家有多大程度的信任,都引发了一些根本性的问题。这是我们想要的科学生态系统吗?

如果朋友们喜欢,敬请关注“知新了了”!

0 阅读:58

知新了了

简介:专注于新知、科普及趣闻的传播,日耕不辍,天天新鲜。