Meta被指控训练LLama模型时使用盗版数据,员工爆料

新识研究所 2025-01-14 18:08:53

原告要求恢复并新增指控,Meta称其为商业内部文件遭驳回

1月10日,有媒体称,根据近日在加利福尼亚联邦法院公开的庭审文件中,一些作家指控Meta Platforms在训练其Llama AI模型时,未经授权使用了盗版电子书和文章数据集LibGen(一个免费访问高质量的学术资源的项目),并通过点对点(P2P)方式下载了大量盗版书籍和文章。而且内部员工还爆料这件事获得了扎克伯格的允许。

此前,这些作家曾在2023年起诉Meta,称其在训练Llama时非法使用他们的作品。

Meta则辩护道,他们对这些作品的使用是“合理的使用”。当时美国地方法官曾驳回了部分原告的诉求,如关于Meta的生成文本侵犯了作者的版权、Meta非法删除书籍版权管理信息的指控。但随着案件的深入调查,新的证据不断涌现。

原告方表示,新证据强化了他们的侵权指控,并要求恢复关于版权管理信息的指控,同时还要新增计算机欺诈指控。在庭审中,法官表示,他将允许原告提交新诉状,但对新增的欺诈和版权管理信息指控表示怀疑。

此外,Meta在法庭上请求对涉及内部信息的文件进行保密处理,称这些文件包含了商业机密。但法官驳回了Meta的这一请求,在裁决中表示,该请求不是为了保护商业机密,而是为了避免负面宣传。

目前,案件仍在审理之中。

作者:杨启隆

编辑:钟响

0 阅读:5
新识研究所

新识研究所

新知识,新见解