“用我的作品砸我的饭碗”,这无疑是生成式人工智能(GenAI)技术出现后,一众创作者始终站在其反面的原因。尽管被AI替代是人类创作者无法摆脱的恐惧,但 “资本家为了利润甚至愿意出卖绞死自己的绳索”,有相当多的创作者和内容拥有者并非反对AI,而是反对自己的作品被免费拿去训练AI。
日前,代表全美2200多家新闻机构的新闻/媒体联盟(News/Media Alliance)发起“支持负责任AI”运动,打出了“保护工作免受AI窃取”、“AI也在偷你的内容”等口号,要求AI企业对内容创作者进行公平补偿,并强制AI生成的内容标注来源、禁止垄断性企业实施胁迫或反竞争操作。
News/Media Alliance的CEO Danielle Coffey表示,“支持负责任AI”运动并不代表美国新闻业抵制AI技术,而是为了确保AI发展反哺优质内容,提升美国新闻业的国际竞争力。
事实上,代表美国新闻机构利益的News/Media Alliance之所以要发起这场抗议行动,是因为OpenAI、Antropic等AI企业在过去两年系统化地采取了未经授权使用相关内容的行为。
没错,新闻机构其实并不介意自己的内容被用于训练AI,而是在意AI企业“白嫖”这些内容。要知道,作为一个17世纪就出现了的古老行业,新闻业并非食古不化,或者说不肯拥抱变化的媒体其实早就已经在信息技术革命中出局了。
进入互联网时代之后,信息大爆炸带来了用户消费信息的门槛大幅降低,新闻媒体就不再是唯一的选择,传统媒体的衰落随之也开始在全球范围内出现。这时候,谷歌、雅虎等互联网平台就向新闻媒体伸出了援手。
在本世纪的第一个十年,互联网巨头与新闻媒体曾有过一段漫长的蜜月期。当时,新闻媒体借助互联网的力量度过了生存危机,让报纸、杂志以电子版的形式被推送到读者眼前,而互联网平台则通过新闻媒体的内容获得了流量。
同样都是被新兴媒介冲击,当年新闻媒体选择了拥抱互联网,现在自然也能毫无障碍地拥抱AI。AI重塑数字时代创作边界不仅是AI行业的期盼,同样也得到了新闻业的认可,只不过在具体的重塑方式上,两者产生了巨大的分歧。
在同样是拥抱变化的情况下,新闻媒体之所以会对互联网厂商和AI企业展现出两幅面孔,其实都是“钱”这个字惹的祸。当年谷歌、Facebook、雅虎使用新闻媒体的内容,却没有忘记给后者分润收益,甚至新闻媒体也是这些互联网厂商所构建数字广告体系中的重要一员。
可到了AI企业,他们却打算“白嫖”,这帮信奉“有效加速主义”(E/Acc)的硅谷AI创业者为了实现通用人工智能已经“魔怔”。随着2023年11月OpenAI宫斗大戏以有效加速主义者Sam Altman的胜出,就已经证明了产品的商业化才是当下AI业界的头等大事。
除了主观上不愿为内容付费,还有相当一批AI企业在客观上确实也没钱。如今许多AI企业最大的难题就是求生存,随着AI投资热的退潮,以及AI泡沫论的兴起,投资者对于AI的态度不仅不再狂热,反而变得愈发审慎,这就使得AI企业想要获得融资的难度变得越来越大。在这样的情况下,AI企业自然就需要商业化、也就是赚到钱,才能获得维持存续的资金。
算法、算力、数据无疑是AI发展的三大引擎。其中,算法则是AI企业的核心竞争力,拥有算法的人更是自由流动,各AI企业都在想方设法留住算法人才。君不见谷歌DeepMind为了防止员工流向竞争对手,甚至直接砸钱让离职员工可以带薪休假。
算力则一直处于供小于求的状态,英伟达更是靠着卖算力芯片把自己给做成了全球最值钱的公司。即便OpenAI、Antropic这样的头部AI企业,也只能从英伟达手里买芯片。
相较之下,数据就不一样了,OpenAI、Antropic等AI企业可以从新闻机构手中“抢夺”数据。谷歌前CEO埃里克・施密特就曾公开表示,AI创业公司可以先通过AI工具盗取知识产权,然后再雇佣律师来处理法律纠纷。
相比于AI企业,新闻媒体、出版商在技术层面就宛如婴孩,更无法与前者的爬虫对抗。只要AI企业抛弃道德感,所谓的robots协议就是一张废纸。换而言之,只要AI厂商愿意,新闻媒体就几乎无法阻拦自己的数据被其无偿使用,而这种无力感也正是新闻媒体结盟,寻求监管力量介入的根源。
既然从技术层面无法阻止AI企业爬取自己的内容,新闻媒体就只能选择“告老师”,将阵地从他们不擅长的信息技术层面,转化为熟稔的社会伦理法治层面。可如今的现实,是即便OpenAI也做不到一次性满足两千多家新闻媒体的诉求,豪横如他们也只能与新闻媒体挨个进行谈判。
当然,AI企业不愿把钱花在数据上的现状必然会被改变,未经授权使用内容的行为始终存在法理上的瑕疵。所以News/Media Alliance大概率会与OpenAI、Antropic、xAI等AI企业妥协,用一个一揽子方案来解决数据问题。