ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。
ChatGPT公司一直在努力让更多新闻机构签署许可协议以训练人工智能模型。 据The Information报道,OpenAI每年提供100万至500万美元的版权新闻文章授权,以训练其人工智能模型。这是人工智能公司计划为授权材料支付多少费用的首批迹象之一。与此同时,最近的一份报告称,苹果正在寻求与媒体公司合作,将内容用于人工智能培训,并在多年期间提供至少5000万美元的数据。The Verge联系了OpenAI,请其对这些数字发表评论。 这些数字似乎与早期的一些非人工智能授权交易大致相似。当Meta推出Facebook新闻标签时后来在欧洲停用了据称它每年提供高达300万美元的新闻报道、头条和预览许可。但目前尚不清楚,总支付额是否会达到我们所看到的一些更大的数字。例如,谷歌在2020年宣布,将投资10亿美元与新闻机构合作。在一项新法律的压力下,谷歌最近还同意每年向加拿大出版商支付总计1亿美元,以换取对其文章的链接。 就我们所知,今天的大型语言模型的训练数据主要是来自互联网的信息。虽然一些人工智能模型没有透露它们是如何获得训练数据的,但通常可以获得有关使用了哪些数据集或网络爬虫的信息。训练数据集的定价因提供者、大小和数据集的内容而异。一些数据提供程序,如LAION,是开源的,完全免费的,被Stable Diffusion等模型使用。人工智能开发人员还经常设置网络爬虫,从互联网上获取数据,以帮助训练他们的模型。(人工智能开发人员仍然需要雇人来审查、标记,有时还要清理培训数据,这大大增加了运营成本。) 但这种做法现在面临着重大挑战。首先,OpenAI的GPT爬虫已经被一些公司阻止访问数据,包括《纽约时报》和The Verge的母公司Vox Media。另一方面,一些组织认为对他们的数据进行培训构成侵犯版权。《纽约时报》(New York Times)等媒体起诉OpenAI和微软侵犯版权,称ChatGPT和微软的Copilot可以生成几乎与其工作内容一字不差的输出。 标签: #OpenAI #ChatGPT #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人