多家新闻机构签署并发布了一封公开信,呼吁提高人工智能的透明度并加强版权保护。

多家新闻机构签署并发布了一封公开信,呼吁提高人工智能的透明度并加强版权保护。 多家媒体组织呼吁制定规则,保护用于训练生成人工智能模型的数据的版权。 这封敦促全球立法者考虑制定法规,要求训练数据集透明,并在使用数据进行训练前征得权利人的同意。他们还要求允许媒体公司与人工智能模型运营商进行谈判,识别人工智能生成的内容,并要求人工智能公司消除其服务中的偏见和错误信息。 这些签署者表示,使用媒体内容训练的基础模型在传播信息时“完全没有考虑原始创作者的报酬或归属”。 信中写道:“这种做法破坏了媒体行业的核心商业模式,这些模式是建立在读者和观众(如订阅)、许可和广告基础上的。”“除了违反版权法之外,由此产生的影响还减少媒体的多样性,并削弱公司投资媒体报道的财务可行性,进一步降低公众获取高质量和可信任信息的途径。”

相关推荐

封面图片

英国政府正在制定提高人工智能训练数据透明度的规则

英国政府正在制定提高人工智能训练数据透明度的规则 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 《金融时报》在对弗雷泽的采访中发现了这一计划。虽然她概述了总体计划,但她不愿透露有关权利人如何检查其材料是否被人工智能模型使用的细节。知情人士透露,政府将在秋季大选前提出建议。这将使利益相关者能够对提案做出回应,并在提案被通过成为法律之前提出建议或修改意见。据《金融时报》报道,欧盟正在根据其人工智能法案制定类似的规则。根据该法案,人工智能开发者将需要提供一份足够详细的培训内容概要,并实施相关政策,以确保他们的操作符合欧盟版权法的规定。像 OpenAI 这样的人工智能公司已经预料到政府会怎么做,并已与数据提供商达成协议。最近几周,OpenAI 宣布与Reddit、Stack Overflow 和《金融时报》合作,帮助其训练模型。此举将受到声称其权利受到侵犯的权利人的欢迎,然而,对于这些人工智能模型的用户来说,由于知识差距,此举可能会导致质量下降。人工智能公司声称,他们可以根据合理使用规则使用这些数据,因为他们对数据的使用是变革性的。最终,我们将不得不等待法院和政治家们的跟进,看看舆论到底是站在权利人一边,还是站在人工智能开发者一边。 ... PC版: 手机版:

封面图片

多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展

多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展 欧洲议会在 6 月 14 日通过了人工智能法案草案,这是欧美第一个全面性的 AI 法规,以确保能够可控监管欧洲公司推出的 AI 模型。但包括德国西门子、法国空中客车、法国育碧、德国银行等超过150名欧洲企业高管日前签署公开信,反对该方案草案,表示该草案限制了相关产业及技术的进步空间。 公开信中声称,人工智能法案草案不仅会危及欧洲企业竞争力,实际上也无法有效解决欧洲所面临的种种技术挑战。该法案草案严格监管了模型的训练数据来源、相应能力、输出结果,并要求任何模型在欧盟区域上市前,都需要向欧盟数据库进行验证,因此开发这些基础人工智能系统的公司将面临不成比例的合规成本和责任风险,这可能会鼓励人工智能提供商完全退出欧洲市场。 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

美国新法案要求人工智能公司披露受版权保护的训练数据

美国新法案要求人工智能公司披露受版权保护的训练数据 美国新法案将迫使科技公司披露用于训练其人工智能模型的任何受版权保护的数据。美国众议员 Adam Schiff (D-CA) 提出的生成人工智能版权披露法案将要求任何为人工智能制作训练数据集的人向版权登记处提交有关其内容的报告。报告应包含数据集中受版权保护的材料的详细摘要以及数据集的 URL (如果可公开获取)。此要求将扩展到对数据集所做的任何更改。公司必须在使用训练数据集的人工智能模型向公众发布之前“不迟于30天”提交报告。该法案不会追溯到现有的人工智能平台,除非其成为法律后对其训练数据集进行更改。

封面图片

纽约时报起诉 OPENAI 和微软侵犯版权

纽约时报起诉 OPENAI 和微软侵犯版权 纽约时报正在起诉 ,OPENAI 和微软,声称这两家公司通过“复制和使用”该刊物的数百万篇文章来建立自己的人工智能模型,现在与该媒体的内容“直接竞争”。 纽约时报称,OPENAI 和微软为 ChatGPT 和 Copilot 提供技术支持的大语言模型可以生成逐字背诵《纽约时报》内容、总结概括其内容并模仿其表达风格的输出。该媒体称,这“破坏和损害”了它与之间读者的关系,同时也剥夺了其“订阅、许可、广告和联盟收入”。 为此《纽约时报》起诉这两家公司侵犯版权,要求他们为涉嫌复制其作品承担“数十亿美元的法定和实际损失”。还要求法院阻止 OpenAI 和微软使用其内容训练他们的人工智能模型,并从数据集中删除《纽约时报》的内容。

封面图片

OpenAI 签署协议以 Reddit 数据训练人工智能

OpenAI 签署协议以 Reddit 数据训练人工智能 人工智能公司 OpenAI 已与 Reddit 达成协议,使用该社交新闻网站的数据来训练人工智能模型。OpenAI 表示,与 Reddit 的合作将使其能够访问 Reddit 上的“实时、结构化和独特内容” (例如帖子和回复),从而使其工具和模型能够“更好地理解和展示”这些内容。Reddit 的内容将被整合到 OpenAI 流行的对话式人工智能 ChatGPT 中,双方将合作为 Reddit 用户和版主带来未具体说明的新“人工智能功能”。OpenAI 也将成为 Reddit 的广告合作伙伴。

封面图片

ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。

ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。 据The Information报道,OpenAI每年提供100万至500万美元的版权新闻文章授权,以训练其人工智能模型。这是人工智能公司计划为授权材料支付多少费用的首批迹象之一。与此同时,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能培训,并在多年期间提供至少5000万美元的数据。The Verge联系了OpenAI,请其对这些数字发表评论。 这些数字似乎与早期的一些非人工智能授权交易大致相似。当Meta推出Facebook新闻标签时后来在欧洲停用了据称它每年提供高达300万美元的新闻报道、头条和预览许可。但目前尚不清楚,总支付额是否会达到我们所看到的一些更大的数字。例如,谷歌在2020年宣布,将投资10亿美元与新闻机构合作。在一项新法律的压力下,谷歌最近还同意每年向加拿大出版商支付总计1亿美元,以换取对其文章的链接。 就我们所知,今天的大型语言模型的训练数据主要是来自互联网的信息。虽然一些人工智能模型没有透露它们是如何获得训练数据的,但通常可以获得有关使用了哪些数据集或网络爬虫的信息。训练数据集的定价因提供者、大小和数据集的内容而异。一些数据提供程序,如LAION,是开源的,完全免费的,被Stable Diffusion等模型使用。人工智能开发人员还经常设置网络爬虫,从互联网上获取数据,以帮助训练他们的模型。(人工智能开发人员仍然需要雇人来审查、标记,有时还要清理培训数据,这大大增加了运营成本。) 但这种做法现在面临着重大挑战。首先,OpenAI的GPT爬虫已经被一些公司阻止访问数据,包括《纽约时报》和The Verge的母公司Vox Media。另一方面,一些组织认为对他们的数据进行培训构成侵犯版权。《纽约时报》(New York Times)等媒体起诉OpenAI和微软侵犯版权,称ChatGPT和微软的Copilot可以生成几乎与其工作内容一字不差的输出。 标签: #OpenAI #ChatGPT #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人