《纽约时报》屏蔽OpenAI的网络爬虫,禁止将其内容用于AI训练

IT之家 2023-08-22 08:24:19

IT之家8月22日消息,《纽约时报》已经屏蔽了OpenAI的网络爬虫,这意味着OpenAI不能使用该出版物的内容来训练其人工智能模型。

查看《纽约时报》的robots.txt页面,就可以看到《纽约时报》封禁了GPTBot,这是OpenAI本月早些时候推出的爬虫程序,据悉《纽约时报》早在8月17日就屏蔽了这个爬虫。

值得一提的是,《纽约时报》本月初更新了其服务条款,该条款禁止使用其内容来训练人工智能模型,《纽约时报》还在考虑对OpenAI提起知识产权侵权的法律诉讼。

IT之家注意到,此前演员SarahSilverman和另外两位作家在7月份就OpenAI使用Books3训练ChatGPT而起诉该公司,Books3是一个用于训练ChatGPT的数据集,可能包含数千部受版权保护的作品,还有一位程序员兼律师MatthewButterick指控该公司的数据抓取行为构成软件盗版侵权。

1 阅读:112
评论列表
  • 2023-08-22 18:51

    人工智能与知识产权保护战开始!

  • 2023-08-22 13:52

    🧠,是不准ai公司使用该媒体的内容

  • 2023-08-23 10:05

    主要是担心假新闻看多了影响AI的智商

  • 2023-08-22 22:30

    我寻思着,openAI的爬虫技术不是早就大规模应用了吗,新推出只是优化版本吧

  • M
    2023-08-22 21:17

    游戏公司?这问的有点肤浅,游戏美术生成,角色AI,SD,MJ都在使用AI,只是国内变成了祸害小朋友的游戏

  • 2023-08-23 11:54

    Code Llama是否能够挑战OpenAI的Codex模型?

  • 2023-08-22 18:07

    支持爬取,没有数据怎么做准

  • 2023-08-22 14:31

    疯了吧,人家压根就不给你用,你上哪喂他毒药。。。

  • 2023-08-23 05:17

    这样做数据会变得越来越不严谨,互联网大部分都是虚假或垃圾信息。

  • 2023-08-23 11:06

    为什么不能让GPT自己连网搜索自己掌握知识呢?

  • 2023-08-24 09:37

    OpenAI的网络爬虫是否应该被允许访问和收集网站内容?

  • 2023-08-23 21:15

    这样训练出来的GPT5一定会是一个百变妖怪。

  • 2023-08-22 10:02

    国内的有毒数据会不会把gpt5练傻了

  • 2023-08-22 13:08

    我允许你走进我的世界,但不允许你在我的世界里走来走去却不跟贴!

  • 2023-08-24 00:21

    你不用,别人也会用,到最后落后的是自己