《纽约时报》封杀 OpenAI 的网络爬虫

《纽约时报》封杀OpenAI的网络爬虫《纽约时报》屏蔽了OpenAI的网络爬虫，这意味着OpenAI无法使用该出版物的内容来训练其人工智能模型。如果你查看《纽约时报》的robots.txt页面，就会发现《纽约时报》禁止使用OpenAI本月早些时候推出的爬虫GPTBot。根据互联网档案馆的WaybackMachine，纽约时报似乎早在8月17日就屏蔽了该爬虫。这一变化是在《纽约时报》本月初更新其服务条款以禁止使用其内容来训练人工智能模型之后发生的。据报道，《纽约时报》还在考虑对OpenAI侵犯知识产权的行为采取法律行动。此前莎拉·西尔弗曼和另外两位作家在7月份就OpenAI使用Books3训练ChatGPT而起诉该公司，Books3是一个用于训练ChatGPT的数据集，可能包含数千部受版权保护的作品，还有一位程序员兼律师马修·巴特里克指控该公司的数据抓取行为构成软件盗版侵权。——

在Telegram中查看

相关推荐

《纽约时报》考虑起诉OpenAI

《纽约时报》考虑起诉OpenAI据报道，OpenAI可能面临《纽约时报》的起诉，原因是该公司使用了《纽约时报》的文章和图片来训练其人工智能模型，这违反了《纽约时报》的如果诉讼成功，OpenAI可能会遭受巨大的损失，包括删除其数据集、支付高额罚款等。为此《纽约时报》在本月更新了其服务条款，禁止任何使用其内容来开发任何软件程序，包括但不限于训练机器学习或AI系统。标签:#NYT#OpenAI频道:@GodlyNews1投稿:@GodlyNewsBot

OpenAI 回应被指控侵权：《纽约时报》提示策略违反其服务条款

OpenAI回应被指控侵权：《纽约时报》提示策略违反其服务条款上周，纽约时报在曼哈顿联邦地区法院对OpenAI和微软发起诉讼，声称对方公司“未经授权而使用了数百万”文章来训练其AI模型，导致其AI生成的内容现在会与《纽约时报》的内容“直接竞争”。OpenAI针对《纽约时报》的侵权指控回应称：该机构一直在文章的开头提示GPT模型，导致模型产出的文本十分接近原文，从而增加了侵犯版权的可能性，相当于是鼓励侵权。OpenAI知识产权和内容主管TomRubin在给《华盛顿邮报》的电子邮件中表示，这些提示违反了OpenAI语言模型的使用条款，《纽约时报》在故意利用这些提示来让模型复制训练数据。他表示，OpenAI一直在努力使其产品能够更好地抵御此类“滥用”。《纽约时报》此前已经屏蔽了OpenAI的网络爬虫，禁止这家公司使用从其网站上抓取到内容来训练其AI模型。对于此次诉讼，纽约时报要求对方公司因涉嫌复制其作品而承担“数十亿美元的法定和实际损失”。投稿：@TNSubmbot频道：@TestFlightCN

纽约时报起诉微软和 OpenAI，指控其侵犯版权

纽约时报起诉微软和OpenAI，指控其侵犯版权纽约时报已起诉微软和OpenAI，指控其侵犯版权，这引发了一场关于生成式人工智能技术对新闻出版业未来具有深远影响的法律争斗。纽约时报表示，这些科技公司未经许可利用其内容创建了他们的人工智能产品，包括OpenAI的ChatGPT和微软的Copilot。该诉讼称，这些工具是基于数百万篇《纽约时报》文章进行训练，并利用这些材料为用户提供答案。据悉，除寻求赔偿外，纽约时报还要求法院禁止科技公司使用其内容，并销毁包含纽约时报作品的数据集。

纽约时报以版权问题为由起诉微软和 OpenAI

纽约时报以版权问题为由起诉微软和OpenAI纽约时报已起诉微软和OpenAI，指控其侵犯版权，这引发了一场关于生成式人工智能技术对新闻出版业未来具有深远影响的法律争斗。纽约时报表示，这些科技公司未经许可利用其内容创建了他们的人工智能产品，包括OpenAI的ChatGPT和微软的Copilot。该诉讼称，这些工具是基于数百万篇《纽约时报》文章进行训练，并利用这些材料为用户提供答案。据悉，除寻求赔偿外，纽约时报还要求法院禁止科技公司使用其内容，并销毁包含纽约时报作品的数据集。(华尔街日报)

纽约时报、CNN和澳大利亚广播公司阻止OpenAI爬虫访问其内容

纽约时报、CNN和澳大利亚广播公司阻止OpenAI爬虫访问其内容TheVerge最先报道了《纽约时报》在其网站上屏蔽了GPTBot。《卫报》随后发现，其他主要新闻网站，包括CNN、路透社、《芝加哥论坛报》、澳大利亚广播公司（ABC）和澳大利亚社区媒体（ACM）品牌，如《堪培拉时报》和《纽卡斯尔先驱报》似乎也倾向于禁止使用网络爬虫。所谓的大型语言模型（如ChatGPT）需要大量信息来训练系统，使其能够以类似人类语言模式的方式回答用户的询问。但是，这些模型背后的公司往往对其数据集中是否存在受版权保护的资料讳莫如深。在出版商的robots.txt文件中可以看到对GPTBot的封杀，这些文件告诉搜索引擎和其他实体的爬虫可以访问哪些页面。"允许GPTBot访问您的网站可以帮助人工智能模型变得更加准确，并提高它们的总体能力和安全性，"OpenAI在一篇博文中说，博文中包含了如何禁止爬虫的说明。所有接受检查的媒体都在八月份添加了该拦截功能。一些媒体还禁止使用CCBot，它是一个名为"CommonCrawl"的开放式网络数据存储库的网络爬虫，也被用于人工智能项目。美国有线电视新闻网（CNN）证实，该公司最近在旗下所有刊物中屏蔽了GPTBot，但并未就该品牌是否计划对其内容在人工智能系统中的使用采取进一步行动发表评论。路透社发言人表示，路透社会定期审查其robots.txt和网站条款。她说："因为知识产权是我们业务的命脉，所以我们必须保护我们内容的版权。"《纽约时报》的一位发言人表示，该公司最近更新了服务条款，更加明确地禁止"为人工智能培训和开发目的......剪切我们的内容"。自8月3日起，其网站规则明确禁止未经同意将出版商的内容用于"开发任何软件程序，包括但不限于训练机器学习或人工智能（AI）系统"。全球新闻机构都面临着是否将人工智能作为新闻采集的一部分，以及如何处理其内容可能被开发人工智能系统的公司吸入训练池的问题。人工智能是新闻业的威胁，还是技术会自我毁灭？8月初，法新社和盖蒂图片社等媒体签署了一封公开信，呼吁对人工智能进行监管，包括"用于创建人工智能模型的所有训练集的构成"的透明度，以及使用受版权保护材料的许可。Google建议，除非出版商明确表示不同意，否则人工智能系统应该可以采集出版商的作品。在向澳大利亚政府提交的一份人工智能监管框架审查报告中，该公司主张"版权制度应允许适当、公平地使用受版权保护的内容，以便在澳大利亚利用广泛多样的数据训练人工智能模型，同时支持可行的退出方式"。OriginalityAI是一家检查是否存在人工智能内容的公司，该公司本周分享的研究发现，包括亚马逊和Shutterstock在内的主要网站也屏蔽了GPTBot。澳大利亚广播公司（ABC）、澳大利亚社区媒体（AustralianCommunityMedia）、《芝加哥论坛报》（ChicagoTribune）、OpenAI和CommonCrawl在截止日期前没有做出回应。...PC版：https://www.cnbeta.com.tw/articles/soft/1379533.htm手机版：https://m.cnbeta.com.tw/view/1379533.htm

纽约时报考虑对 OpenAI 采取法律行动

纽约时报考虑对OpenAI采取法律行动纽约时报和OpenAI可能会对簿公堂。该报的律师考虑采取法律行动以保护版权。纽约时报和OpenAI已就其新闻报道的许可协议展开了为期数周的谈判，但进展不顺。如果纽约时报对OpenAI提起诉讼，这将是AI时代最引人注目的版权纠纷。一位参与谈判的人士表示，如果AI工具在答案中重述了纽约时报的报道，那么用户访问时报网站的可能性将会大大降低。而根据美国联邦法律，如果联邦法官发现OpenAI非法复制时报新闻报道去训练AI模型，那么法庭可以命令OpenAI销毁ChatGPT的数据集，迫使该公司仅使用获得授权的数据重建数据集。联邦版权法还允许对每项蓄意的侵权行为收取最高15万美元的罚款。来源，频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人