一篇文章带你读懂生成式人工智能

Éric Moulines

巴黎综合理工大学统计机器学习教授

Hatim Bourfoune

法国国家科学研究中心（CNRS）密集型科学计算开发与资源研究所（IDRIS）人工智能研究工程师

Pierre Cornette

法国国家科学研究中心（CNRS）密集型科学计算开发与资源研究所（IDRIS）人工智能支持工程师

人工智能的发展日新月异，生成型AI是其中的一种，它能够根据输入的指示，创造出各种文字、图像或声音的内容。这种技术有什么原理？它有哪些应用和局限？它又会带来哪些挑战和风险？本文将为您介绍生成型AI的基本概念、最新进展和未来趋势，让您了解这个正在改变我们社会的创新领域。

生成式AI，指能够学习数据库中的信息，并以此为基础，根据用户输入的提示生成文字、图像或音频的人工智能。

生成式AI仍处于蹒跚学步的阶段，有许多需要改进的地方，比如答案不够可靠或带有偏见。

ChatGPT、Bloom都属于生成式AI的应用模型。潜在的应用还有千千万万待探索。

任何技术有利必有弊。生成式AI耗能极高，而且存在被滥用的风险。

ChatGPT已经成为了当今社会的热议话题，新一轮AI技术革命已初露端倪。生成式AI有看似无穷的潜在应用场景，也毫不意外地引发了无休止的争论。不过，大众对于生成式AI 原理的理解似乎还有待加深。

生成式AI，指能够学习数据库中的信息，并以此为基础，根据用户输入的提示生成文字、图像或音频的人工智能。巴黎综合理工大学的统计机器学习教授Eric Moulines解释说：“AI在学习的过程中，会从数据中概括规律，并基于此生成具有原创性的内容。”

目前两种主流的人工智能模型分别是GPT（生成式预训练转换器）和扩散模型。法国国家科学研究中心（CNRS）密集型科学计算开发与资源研究所（IDRIS）的人工智能研究工程师Hatim Bourfone补充说：“人工智能会通过一种‘注意力机制’理解输入文本的上下文含义。其输出的内容由其之前在训练阶段学习的词汇构成，AI会根据每个词出现的概率，判断接下来该使用哪个词”。用不同的数据库训练算法，便能得到适用于不同情景的AI。

Bourfoune的团队参与开发了一款名为Bloom的AI，这是一款供研究人员使用的学术论文翻译器。IDRIS 研究员Pierre Cornette 说“Bloom模式的主要任务就是学习多门外语。我们给它输入了大量的文本，然后让它根据前文内容去判断下文该出现哪个词。如果出错了，我们会纠正。”

蹒跚学步的新技术

Moulines解释道：“第一代生成式AI模型的历史还不到十年。生成式AI技术的首次突破发生于2017年：转换器技术问世，完善了注意力机制。到2021年，商用生成式AI就上市了，速度之快令人乍舌，比其他深度学习模型都要快得多。”尽管如此，我们必须认识到ChatGPT等AI仍处于蹒跚学步的阶段，有许多需要改进的地方。

Moulines承认，GPT给出的答案的可信度不够高，仍然是个问题：“ChatGPT不知道什么是‘可信度’，不懂得评估自己给出的答案的准确性。”这就是为什么有时候ChatGPT会“一本正经地胡说八道”。“由于ChatGPT纯粹根据概率推理来生成单词序列，所以会生成看似可信，实则虚假的内容。”

除了会“瞎编”，生成式AI还有一些其他的缺陷需要引起我们的注意。AI在深度学习过程中，会大量吸收现有文本，也会内化其中的偏见。Moulines说：“如果你问ChatGPT地缘政治问题，得到的答案都是西方国家的立场。这样的答案中国用户肯定不会认同！”

无穷无尽的潜在应用

生成式AI的魅力在于，通过使用多样化的学习数据库，能够开发出无穷无尽、功能各异的模型。Cornette 说：“生成式AI就如同一台高功率的发动机，可以搭载在拖拉机上，让其发挥最大牵引力，也能安装在赛车中，让其飞驰而过。”若把ChatGPT比作一辆赛车，GPT-4就是它的发动机。“发动机是核心技术。开车的人不须要知道发动机的原理，也能在赛场上风驰电掣。”

Bloom也能反映生成式AI模型的广泛应用潜力。Bourfoune说：“一年前，Bloom是唯一一个对学界完全开放的模型。”任何人都可以下载Bloom并用于自己的研究。经过多语种科学论文数据库的训练，Bloom现在能帮学者轻松理解外语论文。Cornette补充道：“Bloom的开发团队还发起了一个叫Bigcode的项目，用于计算机代码自动生成。只要简单地描述代码的功能，Bigcode就可以用用户指定的编程语言写出具体的代码。”

ChatGPT现在大受欢迎，表明一般用户已经意识到它的实用价值。为了与谷歌竞争，必应已经将GPT的聊天功能整合到其搜索引擎中，这种做法一定程度上能克服生成式AI“胡说八道”的缺点：必应聊天给出的答案中会标注信息来源，便于用户理解并验证内容的可靠性。最近，Adobe将生成式AI模型集成到Photoshop、Illustrator等软件中，展示了另一种新颖应用。

激动人心的未来

从当前的应用来看，生成式AI必将迎来令人振奋的未来，然而也有人担心这一技术可能被滥用。Bourfoune承认：“任何技术有利必有弊。这就为什么OpenAI设置了多重安全屏障。” OpenAI的内容政策也带着这些安全因素的考量，因此在涉及ChatGPT运作的许多问题上，OpenAI都选择保持沉默。

对于仍处于起步阶段的生成式AI技术，Moulines表示：“我们在研究中清楚地知道技术还在起跑线上。生成式AI已经能实际使用，这一点我们都觉得惊讶。”不过，技术仍有许多法律监管等各方面的空白有待填补。由于生成式AI以现有内容数据库为基础生成内容，可能会“剽窃”他人的作品，而不提及原作者的姓名。“以既有内容创作新作品，必须声明原作来源。AI的行为涉嫌侵权。”

尽管生成式AI有各种局限性，但潜力依旧巨大。Moulines 说：“想到未来这一领域可能发生的突破，我心情十分激动。生成式AI的发展势不可挡，衍生应用将如雨后春笋般出现。现在大家都在争相开发新技术，进展很快。” Bloom就属于一种衍生应用，既能促进科学家之间的跨语种交流，又能将论文翻译成稀有小语种，促进科研结果的传播，还有望用于保存濒临灭亡的语言。

不过，在激动之余，不能忽视生成式AI的碳足迹。Moulines解释：“这些模型须要存储大量数据，故需要大量内存。根据我们的估算，OpenAI消耗的能量相当于比利时整个国家电网的耗能。”未来，能耗可能会是生成式AI发展道路上最大的阻碍。

作者

Pablo Andres

编辑

Meister Xia

世良情感网

一篇文章带你读懂生成式人工智能

瞰创新