OpenAI 称不用版权材料是不可能创造出类似 ChatGPT 的 AI 工具

OpenAI称不用版权材料是不可能创造出类似ChatGPT的AI工具OpenAI称不用版权材料是不可能创造出ChatGPT之类的AI工具。ChatGPT等聊天机器人和StableDiffusion等图像生成工具都利用了从互联网上获取的大量数据进行训练，其中大部分数据是受版权保护的。《纽约时报》上个月起诉了OpenAI及其主要投资者微软，称它们“非法使用”其作品创建AI产品。OpenAI在给英国上议院通信数字特别委员会的文件中表示，如果不能获得版权材料，它将无法训练GPT-4等大语言模型。如果将模型训练仅限于公共领域的作品和图像，得到AI系统将无法满足现代公民的需求。OpenAI认为，从法律上说，版权法并不禁止训练。来源，频道：@kejiqu群组：@kejiquchat

在Telegram中查看

相关推荐

OpenAI：如果不使用版权内容，ChatGPT 等 AI 模型不可能开发出来

OpenAI：如果不使用版权内容，ChatGPT等AI模型不可能开发出来ChatGPT开发商OpenAI近日承认，像ChatGPT这样的AI工具的开发离不开受版权保护的素材，并称如果没有这些素材，这些工具根本无法诞生。据《每日电讯报》报道，OpenAI在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。OpenAI在提交给上议院的文件中写道，“由于当前版权涵盖了几乎所有形式的人类表达方式，包括博客文章、照片、论坛帖子、软件代码片段和政府文件，如果不使用受版权保护的内容，就不可能训练当今领先的人工智能模型。”OpenAI进一步表示，如果将训练数据仅限于“一个世纪前”的公共领域书籍和图画，将无法训练出“满足当代公民需求”的AI系统。“使用公开可获取的互联网素材训练AI模型属于合理使用，这一观点得到了长期以来广泛接受的先例的支持，”OpenAI在其周一发布的博客文章中写道，“我们认为，这一原则对创作者是公平的，对创新者是必要的，对美国的竞争力也至关重要。”投稿：@TNSubmbot频道：@TestFlightCN

Sarah Silverman 起诉 Meta 和 OpenAI 侵犯版权

SarahSilverman起诉Meta和OpenAI侵犯版权喜剧演员SarahSilverman以及两名作家RichardKadrey和ChristopherGolden向旧金山联邦法院提起集体诉讼，指控Meta和OpenAI使用受版权保护的材料训练AI聊天机器人。诉讼凸显了生成式AI工具所面临的法律风险。Silverman、Kadrey和Golden指控Meta和OpenAI未经授权使用其书籍开发大语言模型。在针对Meta的诉讼中，原告称泄露的该公司AI业务信息显示他们的作品未经许可被使用。针对OpenAI的诉讼称，ChatGPT生成的原告作品摘要表明它接受了受版权保护内容的训练。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

欧洲数字版权中心投诉 OpenAI 旗下 ChatGPT 提供虚假信息

欧洲数字版权中心投诉OpenAI旗下ChatGPT提供虚假信息4月29日消息，奥地利非营利组织欧洲数字版权中心（Noyb）于4月29日发起投诉，指控OpenAI未修复其生成式AI聊天机器人ChatGPT提供的虚假信息，投诉称OpenAI可能违反了欧盟的隐私规则。根据该组织的说法，此案的投诉人是一位未透露姓名的公众人物，他向OpenAI的聊天机器人询问有关自己的信息，但一直得到错误信息。OpenAI拒绝了该公众人物更正或删除数据的请求，称“这是不可能的”。同时，该公司也拒绝透露其训练数据的信息以及数据来源。

【欧洲数字版权中心投诉OpenAI旗下ChatGPT提供虚假信息】

【欧洲数字版权中心投诉OpenAI旗下ChatGPT提供虚假信息】2024年04月29日05点02分4月29日消息，奥地利非营利组织欧洲数字版权中心（Noyb）于4月29日发起投诉，指控OpenAI未修复其生成式AI聊天机器人ChatGPT提供的虚假信息。其投诉称这可能违反了欧盟的隐私规则。根据该组织的说法，此案的投诉人是一位未透露姓名的公众人物，他向OpenAI的聊天机器人询问有关自己的信息，但一直得到错误信息。OpenAI拒绝了该公众人物更正或删除数据的请求，称“这是不可能的”。同时，该公司也拒绝透露其训练数据的信息以及数据来源。

多位作家指控ChatGPT侵犯版权 OpenAI：你们误解了版权的范围

多位作家指控ChatGPT侵犯版权OpenAI：你们误解了版权的范围参与诉讼的作家包括莎拉·西尔弗曼（SarahSilverman）、保罗·特伦布莱（PaulTremblay）、莫娜·阿瓦德（MonaAwad）、克里斯·戈登（ChrisGolden）和理查德·卡德雷（Richardkadrey）。OpenAI认为，原告的其他指控，包括间接侵犯版权、违反《数字千年版权法》(DMCA)、不正当竞争、疏忽和不当得利等，应从诉讼中剔除。OpenAI声称原告误解了版权的范围，未考虑到限制和例外情况，而这些限制和例外适当地为人工智能领域的创新留出了空间，比如现在处于人工智能前沿的大语言模型。OpenAI表示，即使原告的书籍只是ChatGPT庞大数据集的一小部分，创新者以变革方式使用受版权保护的材料并不侵犯版权，与那些试图通过分发受版权保护的材料直接获利的剽窃者不同。OpenAI辩称，它的目标是“教会其大模型推导出人类语言背后的规则”，以此来帮助人们“节省工作时间”、“让日常生活变得更轻松”，或者通过在ChatGPT中输入提示来自娱自乐。OpenAI认为，版权法的目的是促进科学和实用艺术的进步，保护作者表达思想的方式，而不是保护思想本身、作者所表达的信息中的事实，或其他创造性的组成部分。OpenAI引用了一起涉及谷歌图书的著名版权案件，提醒法院，统计信息如词频、句法模式和主题标记超出了版权保护的范畴。OpenAI写道：“根据由此产生的司法先例，在创作一种新的、不侵权的作品之前，‘批量复制某件作品’并不构成侵权，即使新作品与原作品存在竞争关系。”OpenAI特别希望让法院相信，原告的间接侵犯版权指控属于“错误的法律结论”。原告们认为，ChatGPT的每个输出都是衍生作品，“无论输出与培训作品之间是否有任何相似之处”。OpenAI在驳回动议中举例说明为何ChatGPT的每一个输出都不应视为衍生作品。该公司辩称，与作者作品相关的ChatGPT输出类似于图书报告或书评。OpenAI还反驳称，原告未能证明OpenAI在涉嫌侵犯其作品版权方面获得了直接经济利益。OpenAI声称原告指控自相矛盾OpenAI还试图驳回ChatGPT的训练模型违反《数字千年版权法》（DMCA）的指控。根据作者的说法，任何复制他们作品但不包括版权管理信息(CMI)(如作者姓名或出版年份)的ChatGPT输出，都违反了版权法。原告指控OpenAI故意删除了作品中的版权管理信息。对此，OpenAI反驳称，作者的投诉属于“陈词滥调”，并且“完全没有给出任何合理解释”，比如“OpenAI如何在其训练数据中删除作者姓名和出版年份”，“OpenAI为什么会这样做”，或者“原告相信这种情况发生的基础是什么”。OpenAI表示，没有证据表明公司故意删除了版权管理信息，原告的指控中存在许多自相矛盾的事实，包括原告的书籍被OpenAI完整复制的指控。OpenAI指出，如果从训练数据中删除版权管理信息，可能是技术过程的意外副产物，类似于搜索引擎从互联网上获取图像时未获取相关版权管理信息的情况。OpenAI认为，这种偶然删除版权管理信息的做法不应承担责任，并不能支持OpenAI掩盖不法行为或隐瞒侵权行为的指控。最后，OpenAI认为，原告依据DMCA提出的指控应该被驳回。即使假设ChatGPT的每个输出都是衍生作品，DMCA也不禁止在没有原始作品附带版权管理信息的情况下发布衍生作品。相反，DMCA只禁止在分发原始作品或其副本时删除版权管理信息。OpenAI还表示，原告对OpenAI提出的不正当竞争、疏忽和不当得利等指控也应被驳回，因为这些指控都被联邦版权法所覆盖。如果OpenAI成功推翻了大部分原告的指控，法院只需决定OpenAI的训练模型是否直接侵犯了版权法。这可能意味着，ChatGPT的训练数据违反了法律，要么涉及复制和分发原始作品，要么在未经授权或未进行充分修改的情况下发布了衍生作品。然而，原告们不太可能轻易放弃这场斗争。约瑟夫·萨维里律师事务所（JosephSaveriLawFirm）在总结他们指控的网站上写道，对他们来说，生成式人工智能是一个巨大的骗局，无助于人类智能的进一步发展，而是代表了人类智能的副本，已经被重新打包并与其创造者分离。...PC版：https://www.cnbeta.com.tw/articles/soft/1380719.htm手机版：https://m.cnbeta.com.tw/view/1380719.htm

两位作家起诉OpenAI 称ChatGPT侵犯版权

两位作家起诉OpenAI称ChatGPT侵犯版权特伦布莱的作品有《世界尽头的小屋》，阿瓦德的代表作为《看待胖女孩的13种方式》和《兔子》。这两位作家称，ChatGPT写出的书籍简要，和他们发表的文章一模一样，这说明训练ChatGPT的数据库，是包含了他们的作品的。聊天机器人是在大量的文本数据上进行训练的，OpenAI没有透露训练ChatGPT具体使用了哪些数据，但该公司表示，它通常会抓取网络数据，包括使用档案图书和维基百科等。书籍是训练人工智能的理想选择，因为它们往往包含“高质量、精心编辑的长篇文章”，储存了人类思想的精华。根据起诉书显示，OpenAI的训练数据超过30万本书，其中包括本就备受争议、版权归属不明晰的“影子图书馆”。但要证明ChatGPT是如何以及在哪里收集到这些信息的，以及这些作者是否遭受了经济损失，可能是一个挑战。因为ChatGPT也利用了大量的互联网信息进行训练，包括互联网用户对这些书的讨论。该诉讼代表美国全国范围内的版权所有者，寻求一笔数额不详的赔偿金。目前，OpenAI的代表没有对此事进行回应。萨塞克斯大学知识产权法专业的ndresGuadamuz表示，这是针对ChatGPT的第一起涉及版权的诉讼。他补充说，这起诉讼将探讨生成式人工智能领域“合法性边界”的问题。而就在几天之前，OpenAI在加利福尼亚州同样被多方提起集体诉讼，起诉书称OpenAI在未经允许的前提下，在互联网上窃取和挪用了大量私人数据来训练ChatGPT。...PC版：https://www.cnbeta.com.tw/articles/soft/1369241.htm手机版：https://m.cnbeta.com.tw/view/1369241.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人