13家媒体怒告OpenAl等AI巨头背后：内容创作为何成了大模型的“免费午餐”？

13家媒体怒告OpenAl等AI巨头背后：内容创作为何成了大模型的“免费午餐”？然而，对于到底“投喂”了什么数据，是否获取授权，这些AI公司总是讳莫如深。伯克利计算机科学家Stuart Russell等学者认为，大模型吞噬了大多数互联网信息，以复制人类智能并将其以自动化形式镜像回馈给我们。当意识到其网站上发布的故事都被自动抓取成了大模型的“食物”后，以《纽约时报》为首的媒体/出版机构向OpenAI等发起了版权诉讼。《每日经济新闻》记者在采访哈佛法学院教授丽贝卡•塔什内特、安杰世泽律师事务所合伙人于雯竹后了解到，此类案件判定的难点在于如何确定AI输出内容与媒体报道间的“实质性相似”。而另一方面，OpenAI等科技公司也向媒体/出版机构抛出了橄榄枝，因为数据总有耗光的一天。研究机构Epoch AI近期预测，大模型将在2026年至2032年之间消耗完所有可用数据。“应该大声要求赔偿” ！13家媒体发起反击2009年末，媒体大亨罗伯特•默多克曾在一场论坛上说：“有些人觉得他们有权拿走我们的新闻内容，还无需为新闻生产贡献一分钱。他们几乎侵吞了我们的全部新闻，这可不是合理使用。说得直白些，这就是偷。”当时，随着Google等新兴互联网公司的出现，美国报业的广告收入腰斩。而如今，OpenAI等生成式AI公司的强势崛起，类似的一幕似乎又开始重演。新闻集团首席执行官罗伯特•汤姆森就曾表示，“[媒体]的集体知识产权正受到威胁，我们应该大声要求赔偿。”新闻行业律师Steven Lieberman更是直言，OpenAI的巨大成功也要归功于其他人的工作，它在未经许可或付款的情况下获取了大量优质内容。据外媒，ChatGPT主要通过阅读书籍、文章和公开的网络内容来学习，包括来自互联网的在线新闻文章。类似的大语言模型也依赖的是社交媒体帖子、博客、数字化书籍、在线评论、维基百科页面以及您能想到的几乎所有的网络信息。在意识到ChatGPT对历史和时事的了解源自其网站上发布的故事（甚至是付费内容）时，去年年底，《纽约时报》对OpenAI以及微软提起诉讼，指控后者未经授权使用该报版权内容训练AI模型，并在ChatGPT产品中呈现给用户。该案打响了媒体机构起诉OpenAI的第一枪，随后又有多家媒体加入了这一反抗的队列。据《每日经济新闻》记者的不完全统计，截至今年6月底，已至少有13家新闻媒体机构对OpenAI和微软提起了侵权诉讼。这里面有Alden Global投资集团旗下的八家地区性知名报纸，包括芝加哥论坛报、纽约每日新闻、丹佛邮报、圣何塞水星报，还有数字新闻媒体The Intercept、Raw Story和AlterNet，以及非盈利新闻组织The Center for Investigative Reporting。图片来源：每经制图“判断这种数据抓取行为是否侵犯版权，是一个复杂且有争议的问题。”安杰世泽律师事务所合伙人、中国和美国纽约州执业律师于雯竹在接受每经记者采访时表示。这起诉讼只是各行业与生成式AI公司斗争的缩影。美国当地时间6月24日，全球三大唱片公司索尼音乐集团、环球音乐集团和华纳音乐联合多家唱片公司，向AI音乐生成公司Suno和Udio开发商Uncharted Labs发起诉讼，指控后者非法使用版权音乐来训练模型并提供服务。唱片公司指控Suno抄袭了662首歌曲，Udio抄袭了1670首歌曲，正在尝试索取每件音乐作品最高15万美元的赔偿费用。8个月的角力尚无结果：“实质性相似”还是“合理使用”？越来越多的关于生成式AI技术的法律之争也让人开始正视媒体/出版商与颠覆性技术之间的关系。据著名广告周刊Adweek，Google去年5月推出了基于AI的搜索引擎Search Generative Experience（SGE）测试版，接受采访的媒体高管和搜索引擎优化专家称，出版商必须为自然搜索流量的大幅下降做好准备，下降幅度可能在20%到60%之间。而出版商在开放网络上的搜索流量减少通常意味着数字广告收入下降。新型媒体公司Raptive创新执行副总裁Marc McCollum估计，在目前的SGE下，整个出版业每年的广告收入损失可能高达20亿美元。而《纽约时报》的起诉不仅是媒体领域的重要里程碑案件，亦可以为法律业界提供极具参考价值的信息。“就版权法而言，本案的重要影响在于版权法在数字和AI时代的适用范围。特别是对于新闻报道这类具有较高公共利益的文本内容，如何平衡版权保护和信息自由将成为一个关键问题。” 于雯竹对记者说道。在于雯竹看来，如果《纽约时报》的诉讼获得成功，将树立一个重要的法律先例，鼓励其他文字类媒体、版权机构和作家团体组织跟随起诉OpenAI及类似的AI公司。本案可能会督促AI公司重视AI模型训练的合法性，可能推动相关行业规范的建立。目前，该案件已经持续将近8个月，但还没有定论。1）媒体之难：证明“实质性相似”《纽约时报》在起诉书中称，ChatGPT几乎逐字复制了其新闻报道。该报举例称，2019年，《纽约时报》发表了一篇荣获普利策奖的关于纽约市出租车行业掠夺性贷款的系列文章。该报称，只要稍加提示，ChatGPT就会一字不差地背诵其中的大部分内容。来源：《纽约时报》起诉书在其他多家媒体的起诉书中，记者发现，其法律论证和主张都基于美国1976年版权法和《数字千年版权法》（DMCA）。对于这两部法案中涉及AI的内容，于律师告诉记者，“就1976年版权法而言，侵权的判定通常依赖于原作品和被指控侵权作品之间的相似性，以及实际的复制行为。本案中实际复制行为相对容易证明，因为OpenAI并未否认其训练数据中包含《纽约时报》的文章。”然而难点在于，“证明最终生成的文本构成版权侵权仍需满足‘实质性相似’测试，因为它有助于判断受版权保护的表达元素是否被复制，还是仅复制了其中的思想。版权保护的是表达，而不是思想。你可以用自己的语言重新实现他人的思想，这不构成版权侵权。但如果你使用他人的语言即他们的表达那就是版权侵权。”于律师说道。谈及DMCA，于雯竹解释道：“其中的一项规定鼓励版权持有者在数字资产中添加内容管理信息（CMI），例如帮助识别创作者或权利持有者的信息，并禁止他人移除这些信息。”然而，《纽约时报》起诉书提到，OpenAI在抓取其文章以创建数据库时，移除了这些信息，违反了DMCA。来源：《纽约时报》起诉书“实际上，美国是判例法国家，而其版权法及DMCA并未特别规定与AI相关的法律内容，对于OpenAI的行为是否属于侵权的认定，法院依据的是相关的先例及其对相关法律条文的解释。”于雯竹表示。2）OpenAI的“盾牌”：“合理使用”而在回应《纽约时报》版权侵权诉讼时，OpenAI强调使用公开材料训练AI模型属于合理使用。这一规则基于美国1976年版权法第 107 条规定。哈佛法学院教授丽贝卡•塔什内特（Rebecca Tushnet）在接受《每日经济新闻》记者采访时认为，“美国版权法既提供了广泛的权利，也提供了广泛的例外。关键问题是AI训练是否构成‘合理使用’，以及当AI输出与现有作品过于相似时，该问题到底应该归咎于模型还是用户的滥用。”塔什内特认为，“OpenAI提供了有一个有趣的主张，即（AI）要获得高度相似的输出，必须故意用《纽约时报》原始文章中的大量引文来提示模型，这表明错误在于提示者（用户的滥用）。”“‘合理使用’是美国版权法的一项关键优势，使其能够应对不断变化的情况。它促成了我们所知道的现代互联网的兴起，尤其是搜索引擎。按照同样的推理，只要输出通常不是从特定作品中复制而来，创建AI模型就应该被视为变革性的和公平的。” 她对... PC版：手机版：

在Telegram中查看

相关推荐

纽约时报考虑对 OpenAI 采取法律行动

纽约时报考虑对 OpenAI 采取法律行动纽约时报和 OpenAI 可能会对簿公堂。该报的律师考虑采取法律行动以保护版权。纽约时报和 OpenAI 已就其新闻报道的许可协议展开了为期数周的谈判，但进展不顺。如果纽约时报对 OpenAI 提起诉讼，这将是 AI 时代最引人注目的版权纠纷。一位参与谈判的人士表示，如果 AI 工具在答案中重述了纽约时报的报道，那么用户访问时报网站的可能性将会大大降低。而根据美国联邦法律，如果联邦法官发现 OpenAI 非法复制时报新闻报道去训练 AI 模型，那么法庭可以命令 OpenAI 销毁 ChatGPT 的数据集，迫使该公司仅使用获得授权的数据重建数据集。联邦版权法还允许对每项蓄意的侵权行为收取最高 15 万美元的罚款。来源，频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

OpenAI 已经与News Corp（新闻集团）达成了一项协议，集团旗下拥有《华尔街日报》、《纽约邮报》、《每日电讯报》等

OpenAI 已经与News Corp（新闻集团）达成了一项协议，新闻集团旗下拥有《华尔街日报》、《纽约邮报》、《每日电讯报》等多家媒体。据《华尔街日报》报道，OpenAI 与新闻集团的这项协议在未来五年内的价值可能超过 2.5 亿美元，形式为现金及使用 OpenAI 技术的信用额度。这份为期多年的协议授予 OpenAI 访问新闻集团出版物的现有和存档文章的权限，用于 AI 训练和回答用户问题。这是 OpenAI 与包括美联社、金融时报、《人物》杂志出版商 Dotdash Meredith 以及 Politico 的所有者 Axel Springer 在内的多家主要媒体公司和机构达成的最新一系列授权协议。与此同时，一些媒体机构如《纽约时报》、《纽约每日新闻》、《芝加哥论坛报》和《The Intercept》则选择对 OpenAI 提起诉讼。他们指控 OpenAI 和微软通过使用他们的作品来训练 AI 模型，侵犯了版权。标签: #OpenAI #AI #版权频道: @GodlyNews1 投稿: @GodlyNewsBot

纽约时报起诉 OPENAI 和微软侵犯版权

纽约时报起诉 OPENAI 和微软侵犯版权纽约时报正在起诉，OPENAI 和微软，声称这两家公司通过“复制和使用”该刊物的数百万篇文章来建立自己的人工智能模型，现在与该媒体的内容“直接竞争”。纽约时报称，OPENAI 和微软为 ChatGPT 和 Copilot 提供技术支持的大语言模型可以生成逐字背诵《纽约时报》内容、总结概括其内容并模仿其表达风格的输出。该媒体称，这“破坏和损害”了它与之间读者的关系，同时也剥夺了其“订阅、许可、广告和联盟收入”。为此《纽约时报》起诉这两家公司侵犯版权，要求他们为涉嫌复制其作品承担“数十亿美元的法定和实际损失”。还要求法院阻止 OpenAI 和微软使用其内容训练他们的人工智能模型，并从数据集中删除《纽约时报》的内容。

微软在驳回《纽约时报》有关AI侵犯版权诉讼的动议中引述录像机的作用

微软在驳回《纽约时报》有关AI侵犯版权诉讼的动议中引述录像机的作用《纽约时报》此前起诉微软涉嫌抓取其报道并利用这些数据模仿其风格，但微软的律师现在辩称，OpenAI 的大型语言模型只是众多技术中的最新技术，尽管这些技术有可能被滥用版权，但仍被视为合法技术。有一段话是这样写的："尽管《纽约时报》声称，版权法对大型语言模型的阻碍并不亚于对录像机（或钢琴演奏机、复印机、个人电脑、互联网或搜索引擎）的阻碍。"苏斯曼-戈弗雷公司（Susman Godfrey）合伙人、《纽约时报》首席法律顾问伊恩-克罗斯比（Ian Crosby）表示，微软并未对其与 OpenAI 合作抓取该刊物报道的行为提出异议。Crosby说："相反，它奇怪地将LLMs与录像机相提并论，尽管录像机制造商从未辩称有必要大规模侵犯版权来制造他们的产品。"微软还对《纽约时报》关于微软知道并通过提供使用OpenAI的GPT模型的产品诱导用户侵犯版权的指控提出质疑，认为《纽约时报》从未举出Copilot用户直接侵权的例子。"因此，《纽约时报》的共同侵权理论与四十年前对录像机的质疑一样失败了：它试图'仅仅[基于]设计或销售能够大量合法使用的产品'而施加责任，这是不恰当的。"微软还声称，《纽约时报》没有证明微软故意从训练数据中删除版权管理信息（如版权所有者姓名）违反了《数字千年版权法》（DMCA）。微软指出，其他使用与《时代周刊》相同论据的生成式人工智能诉讼也被驳回，，比如包括莎拉-西尔弗曼（Sarah Silverman）在内的作家提起的诉讼、像《纽约时报》起诉 OpenAI 和微软这样的诉讼有可能改写生成式人工智能作为一个行业的持续发展方式。OpenAI 也提出了自己的驳回动议；它声称《纽约时报》"欺骗"了 ChatGPT，使其直接复制了该出版物的版权材料。相关文章:《纽约时报》起诉 OpenAI 和微软侵犯版权纽约时报要求OpenAI销毁其“盗用”的最重要训练数据 ... PC版：手机版：

OpenAI与新闻集团的交易授权《华尔街日报》、《纽约邮报》等媒体的内容

OpenAI与新闻集团的交易授权《华尔街日报》、《纽约邮报》等媒体的内容这份多年期协议使 OpenAI 可以访问新闻集团出版物中的最新文章和存档文章，用于人工智能培训和回答用户问题。这是OpenAI与美联社、《金融时报》、《人物》出版商Dotdash Meredith和Politico所有者Axel Springer等大型媒体公司和媒体达成的一系列许可协议中的最新一例。一些媒体反而对 OpenAI 提起了诉讼，如《纽约时报》、《纽约每日新闻》、《芝加哥论坛报》和《截击》，他们指控 OpenAI 和微软在他们的作品上训练人工智能模型，侵犯了版权。新闻集团称将借此与 OpenAI "分享新闻专业知识"，以"确保最高的新闻标准"。 ... PC版：手机版：

【OpenAI回应被指控侵权：《纽约时报》提示策略违反其服务条款】OpenAI表示，《纽约时报》一直在文章的开头提示GPT模型，

【OpenAI回应被指控侵权：《纽约时报》提示策略违反其服务条款】OpenAI表示，《纽约时报》一直在文章的开头提示GPT模型，导致模型产出的文本十分接近原文，从而增加了侵犯版权的可能性，相当于是鼓励侵权。这些提示违反了OpenAI语言模型的使用条款，《纽约时报》故意利用这些提示来让模型复制训练数据。 #抽屉IT

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人