“书籍海啸”时代到来:一切都不再是原创,但读者喜欢?

飞绿聊国际 2023-07-13 22:42:02

这些年,人工智能的快速发展引发了科技、教育和医疗等诸多产业的热议。相比之下,在被视为具有创意性、艺术性和思想性的图书出版业,相关的讨论仍然有限。然而,这一趋势波及至图书出版领域似乎只是时间早晚的问题。

实际上,人工智能对出版业的影响已经开始显现。仅在聊天机器人程序ChatGPT上线后不久,亚马逊的Kindle商店网页便出现了200多本作者或合著者均为ChatGPT的电子书。一位使用机器人辅助写作的作者甚至吹嘘说,他在不到一天的时间里就写出了一本119页的中篇小说,一年可以出版300本类似的书。曾几何时,在读者与出版人眼中,亚马逊或许意味着一条宽约5公里、长约6400公里的图书河流。但随着人工智能的快速发展,曾经的书籍洪流可能会变成一场书籍海啸。人工智能将会在不生产任何伟大作品的情况下撼动图书世界的价值吗?

千年前印刷术的发明曾掀起过一场大众传播知识的革命,但那次也只是攻克了出版中的印刷一环,是技术力量的冰山一角。那么,当生成式人工智能完全融入出版的全流程,图书出版业将会是怎样的图景?当ChatGPT能够即刻“回答这个问题”,这会削弱书籍本身的吸引力吗?以及人工智能时代的阅读可能会变成什么样子?

通过梳理国内外与此相关的最新讨论,我们会发现,相比于其他行业而言,出版业在新技术的接受方面表现得更为缓慢,但人工智能对出版业的渗透却相当迅猛,从创作编辑到宣发销售,人工智能正在悄然撬动出版界的一场新的“印刷革命”。如果说传统的出版流程开始于作者的创作,最后抵达潜在的读者群体,那么人工智能时代的出版业可能恰好相反。本期读刊即聚焦这一趋势,先从传统图书生产流通的最末一环“营销”说起,进而回溯至书籍的图文编辑环节,最终落回创作者对“人机合著”的兴奋与恐惧。

图书营销可能是最先被颠覆的环节

  ▲《书迷》剧照。(图片来自新京报)

决定一本图书能否畅销的关键在于创作者吗?实际答案可能会让许多读者大跌眼镜。美国知名网络杂志Slate近日发布的一篇文章指出,“好书”就能成为图书市场的爆款?这其实是一个残酷的笑话,尤其是在人工智能时代。

该文章作者称,出版业本质上是靠热门图书生存的,但这些作品的成功并不完全归功于文本质量。例如,哈里王子今年出版的回忆录首日销量就突破了40万册,成为英国有史以来销量攀升最快的非虚构作品。然而,这部作品之所以能取得如此显著的业绩,是因为它最深刻地剖析了我们这个时代的人类状况吗?实际可能并非如此。在图书泛滥的今天,对于大多数作品而言,取得“突破”需要的更多是运气而不是技巧。而令许多出版商苦苦挣扎的,是如何在书籍与它的目标读者间建立联系。

然而这一点恰恰是人工智能最为擅长的。与人类读者不同,人工智能能够阅读每年出版的数百万本书籍,因此它可以向每个读者定向推荐最适合其阅读趣味的书籍——不是名人代笔、不是某些评论家碰巧喜欢的书、不是引起轰动的畅销之作、不是一两个有影响力的人有意推动的书、不是那些在华而不实的书籍预告中频频被吹捧的书,但是于你而言最完美的书。在文章作者看来,相比于模仿写作者的风格去创作,人工智能未来更有可能被训练去捕捉揣摩不同读者的阅读品位。

电子出版分析师萨德·麦克罗伊(Thad Mcllroy)也持相近的看法。他在近日发表于《出版人周刊》的评论文章中断言,图书营销可能是最先被人工智能颠覆的环节。提供有力的实时市场情况、了解正在抢夺销售的书籍以及错失的机会、帮助作家找到他们理想的读者群体、给读者提供完美的下一本读物,这些都是人工智能的拿手活。更重要的是,这一技术对于近年来不断涌现的自我出版作者无疑是一个喜讯,人工智能所引发的出版转型将打破亚马逊等在线零售商在分销生态系统中的地位,帮助作家与读者建立更为直接的联系。

  ▲《书店》剧照。(图片来自新京报)

此外,从传统出版宣发流程来看,一本书在抵达读者之前最先接触的其实是中介化的媒体,经由媒体实现大规模的新书推荐与信息分发。而在实际对接过程中,由于营销编辑的精力有限,出版社经常“打包”提供宣传资料,无差别递送至不同终端,导致实际传播效果有限。在前不久结束的“2023译想论坛”中,资深媒体人侯虹斌提到借助ChatGPT将一本新书卖出30万本的可能性。ChatGPT会按照不同的传播机构进行打包,将图书资料中的语言全部打散后重新拼贴,结合不同媒体的内容风格定性分发。“ChatGPT可能一分钟生成出50种-100种不同的表达方式。但是如果我要用宣发人员,或者是新闻媒体,可能一个人写两种就已经写吐了。”

上述想象仍然建立在以书为基础的层面,但据多项研究表明,成年人花在闲暇时间中阅读的时间不到5%,而用于玩游戏和在线观看视频的时间比例却在不断增加。当电影与视频游戏深度融合,传统的图书出版会更加边缘化吗?对此,麦克罗伊认为,人工智能可能会将图书以前所未有的方式转变为产生收入的媒介。各类增强版电子书及有声书正在涌入市场。

据英国多家媒体预告,今年八月将出版乔治·奥威尔(George Orwell)讽刺中篇小说《动物农场》(Animal Farm)的人工智能驱动“活书”版本。这个版本的《动物农场》将允许读者与角色互动并讨论事件的展开。除了互动对话之外,“活的”电子书还将包括音频和视频元素。“1945年发表的《动物农场》在今天同样具有现实意义。”该版本的出版方Legible公司认为,在人工智能的加持下,许多经典书目将有可能以另一种方式“复活”,与今天的读者产生更加直观的连接与互动。

走向自动化的图文编辑?

  ▲《编舟记》剧照。(图片来自新京报)

“我自己看书是为了享受阅读的乐趣,但是如果是工作,我会让ChatGPT完成。”在关于ChatGPT如何影响出版业的那场论坛中,侯虹斌谈到人工智能在图文编辑上的应用空间。她认为,人工智能可能会用于“分析独特性”式的查重,筛查写作者在文中哪几处化用了前人已用过的情节。出版人杨文轩则表示,ChatGPT虽然有强大的文本生成的能力,但其最大的能力其实是文本挖掘。具体到编辑层面,ChatGPT可以对文本进行深度分析。“把它的思维导图、人物关系图全部列出来,哪一个地方有逻辑的BUG、断点,然后再去写文案。整个一套生产流程,书名、提炼以及对文稿逻辑,包括错别字、病句等都可以进行处理。”

在这种情况下,生成式人工智能有可能会成为废稿堆的“守护神”吗?在麦克罗伊看来,ChatGPT可能无法发现那些极其出色的杰作,但它会知道如何区分好坏。的确,有些书稿被100家出版商拒绝,但却成为意外畅销书,这种现象时有发生,生成式人工智能也可能会犯这样的错误,但不要忘了那100位声称经过良好培训的出版行业的专业人士也错过了。

除传统的文字编辑,人工智能同样擅长借助大数据库进行图片处理。出版顾问简·弗里德曼(Jane Friedman)注意到,图书市场已经有大量自行出版的带有人工智能生成艺术的儿童图画书和图画小说,但她还没有看到传统出版商将这样的东西推向市场,不过这“只是时间问题”。事实上,英国布卢姆斯伯里出版公司(Bloomsbury)最近已经承认在一部成人奇幻作品《大地与血之屋》(暂译,House of Earth and Blood)的英国封面中使用了人工智能。“我的猜测是,出版商一开始会觉得使用人工智能来制作小插图是最舒服的。但设计师已经在使用人工智能工具来帮助进行封面设计了。”

那么,人工设计的封面与AI设计的封面是否存在明显的差异?为了测试人工智能生成的书籍封面的辨识度,印度一家媒体通过文本图像生成器自动生成了两部作品的封面,并将它们同时发给印度国内一位资深平面设计师苏南迪尼·班纳吉(Sunandini Banerjee)。考虑到不同类别书目的封面风格差异,他们分别选择了小说《德古拉》和偏抽象的理论作品《东方主义》。

  ▲《德古拉》封面(左为AI设计,右为原版);《东方主义》封面(左为AI设计,右为原版)。(图片来自新京报)

据称,AI总共花费不到两小时便“制作”出了这两个封面,经验丰富的用户可能还可以在更短的时间内生成更复杂的图像。从画面效果来看,班纳吉称《德古拉》的封面“很普通,毫无特色”。而对于《东方主义》,她则表示封面“简直太糟糕了”,认为图像质量差、多个物体让观众无法找到核心主题,而且字体也不合适。

  ▲新书书讯中,ChatGPT被列入作者栏。(图片来自亚马逊官网)

值得注意的是,除了审美观感,AI封面的另一个问题还涉及版权。2023年1月,图片提供商盖蒂图片社(Getty Images)表示正在起诉一家人工智能初创公司Stability AI,该公司创建了一种名为Stable Diffusion的文本到图像模型。盖蒂图片社指责这家公司非法使用其图片来训练模型。如果书籍封面是使用文本到图像平台制作的,其中数据集包含受版权保护的图像,则尚不清楚这样的封面可以在多大程度上受到法律保护。然而,目前亚马逊上有多本自行出版的书籍将ChatGPT列为作者,将AI绘画工具Midjourney列为插画家,甚至将两者同时列出。

回到写作:我们与机器没那么不同?

  ▲《天才捕手》剧照。(图片来自新京报)

人工智能的发展同样引发创作界人士的热议,毕竟它撼动了长期以来被认为是人工把持的领域。从国内外创作者谈论它的方式来看,人工智能写作已经进入了普通工具和自动讲故事机器之间的幽谷。而这种模糊性部分解释了它为何会令出版业内外既兴奋又不安。

根据ChatGPT第四代功能属性来看,它已经基本具备了与用户建立对话的能力。但至于它是否会取代人类写作,美国科技网站The Verge的一篇专栏文章认为,人工智能将首先接管的是“低关注”文本(low-attention text)的写作。这类文本主要是功能性的,可以快速传达信息或只是填充空间。它在书面世界中所占的比例也比想象得要大,不仅包括营销博客,还包括工作互动和日常闲聊。

这意味着,如果向它们询问一些简单的琐事,比如首都城市或美国总统的生日,它们大多数时候都是对的。因为输入的文本以足够的频率向其提供了正确的信息。但如果你将它们推向任何给定的主题或偏离的领域,它们就会不假思索地撒谎,编造引文、日期、传记细节以及你想听到的任何其他内容。例如询问一些奇怪的问题,它们可能会自信地断言“一支铅笔比烤面包机重”,或者“一片叶子只有一只眼睛”。这些答案揭示了统计智能和具身智能之间的鸿沟。

  ▲《书店》剧照。(图片来自新京报)

就文本写作而言,目前趋势表明ChatGPT可能暂时不会被用来写整本书,而是帮助作者更快地写书。Verge的另一篇文章讲述了自行出版作者詹妮弗·莱普(Jennifer Lepp)的创作经历。她正在写美国佛罗里达州女侦探系列小说中的最新篇目,她给自己分配了整整49天的时间来撰写和自行编辑这本书。此前,她曾经通过调查问卷询问过读者,最长在两本书之间等待多长时间后就会选择转向另一位作家。最后的得出的答案是平均四个月。而电子表格显示,她的实际进度落后于计划。

为此,她不得不尝试使用一款名为Sudowrite的人工智能编写程序。这是一款专为小说作家量身定制的应用,作者可以将他们所写的内容粘贴到舒缓的日落色界面中,选择一些单词,然后让人工智能以不祥的语气或添加更多的心理冲突来重写它们,或增设情节的转折,或生成各种意义上的描述加隐喻。莱普从已经写好的部分中节选了约500字的片段,关于女侦探和一群名为“肉豆蔻”的小精灵在沼泽中交手的过程,粘贴至文本框后跳出:

“肉豆蔻的头发是红色的,但她明亮的绿色眼睛表明,她与夜间生物的共同点比与白天的生物更多。”

从输出的文本来看,生成式人工智能扮演的其实是“单词预测机”的作用,在输入大量文本后,该模型会调整数十亿个最初随机的数学参数,直到出现新文本时,它可以很好地预测接下来会出现什么单词。但归根结底,它的整个世界都是单词,或者更准确地说,是称为标记的常见字符序列的数学公式,而当文本越长时,预测就越困难。换言之,如果让GPT-3单独写一篇文章,它可能会产生一系列重复的、有时正确但经常矛盾的断言,随后逐渐偏离主题,直到达到记忆极限并完全忘记是从哪里开始的。这就要求创作者对人工智能输出的文本进行后续的编辑修改。而这个过程虽然减少了原创输出的压力,但修改本身也带来了精神的损耗。作家小白就曾坦言:“与ChatGPT合写小说,要耗费我三倍精力。”

  ▲《书店》剧照。(图片来自新京报)

尽管如此,不少创作人士仍在尝试“人机合著”。莱普称她向读者提供的是“薯片书籍”,但迫于时效压力没有办法。而这是以莱普为代表的众多独立作家所面临的共同处境。为了在一个点击鼠标即可获得无数其他选择的市场中生存,作者需要找到他们的粉丝,并保持他们的忠诚度。因此,他们只得跟随读者进入算法依据其风格将他们划入的小流派,并通过连续写作来吸引这部分读者的注意力。人工智能时代正在将作者与读者的关系转变为服务提供商和客户的关系,而客户永远是对的。最重要的是,作者必须写得快。“然后一切都不再是原创的了。一切都只是其他东西的复制品,”莱普说,“问题是,这就是读者喜欢的。”

实际上,关于原创性的讨论已经沦为老生常谈。美国知名网络杂志Slate近日发布的文章中提到,在写作方面,我们与机器实则并没有想象中那么不同。如果人工智能的“创造力”和“独创性”归结为奇特的数据和训练有素的模型练习,那么与人类有何根本不同?毕竟,人类作家也是通过沉浸在模型文本中来学习写作的,模仿“好文章”的潜在标准似乎是模仿到“抄袭”的边缘,但同时又不至于沦为完全的“抄袭”。究其本质,语言本身也是一种模仿,而我们用二手话语来思考与表达,并借此传承了数千年。但文章同样指出,每一位值得一读的作家最终都会发明自己的语言,他们将现有的共享语言重新牵引到一个新的方向,描绘那个只有他们能够看到的世界。如果人工智能未来确实是有知觉的,那么它终有一天将会根据自己的经验说话。(完)

作者/申璐

0 阅读:0

飞绿聊国际

简介:感谢大家的关注