IT之家8月22日消息,《纽约时报》已经屏蔽了OpenAI的网络爬虫,这意味着OpenAI不能使用该出版物的内容来训练其人工智能模型。
查看《纽约时报》的robots.txt页面,就可以看到《纽约时报》封禁了GPTBot,这是OpenAI本月早些时候推出的爬虫程序,据悉《纽约时报》早在8月17日就屏蔽了这个爬虫。
值得一提的是,《纽约时报》本月初更新了其服务条款,该条款禁止使用其内容来训练人工智能模型,《纽约时报》还在考虑对OpenAI提起知识产权侵权的法律诉讼。
IT之家注意到,此前演员SarahSilverman和另外两位作家在7月份就OpenAI使用Books3训练ChatGPT而起诉该公司,Books3是一个用于训练ChatGPT的数据集,可能包含数千部受版权保护的作品,还有一位程序员兼律师MatthewButterick指控该公司的数据抓取行为构成软件盗版侵权。
人工智能与知识产权保护战开始!
🧠,是不准ai公司使用该媒体的内容
主要是担心假新闻看多了影响AI的智商
我寻思着,openAI的爬虫技术不是早就大规模应用了吗,新推出只是优化版本吧
游戏公司?这问的有点肤浅,游戏美术生成,角色AI,SD,MJ都在使用AI,只是国内变成了祸害小朋友的游戏
Code Llama是否能够挑战OpenAI的Codex模型?
支持爬取,没有数据怎么做准
疯了吧,人家压根就不给你用,你上哪喂他毒药。。。
这样做数据会变得越来越不严谨,互联网大部分都是虚假或垃圾信息。
为什么不能让GPT自己连网搜索自己掌握知识呢?
OpenAI的网络爬虫是否应该被允许访问和收集网站内容?
这样训练出来的GPT5一定会是一个百变妖怪。
国内的有毒数据会不会把gpt5练傻了
我允许你走进我的世界,但不允许你在我的世界里走来走去却不跟贴!
你不用,别人也会用,到最后落后的是自己