禁止白嫖!Reddit 不再免费提供数据,想要抓取数据训练 AI 必须付费

None

相关推荐

封面图片

Reddit不再给AI公司免费提供数据

Reddit不再给AI公司免费提供数据 Reddit 是目前多数 AI 最重要的训练数据来源之一,包括 ChatGPT 和 Bard 等都使用 Reddit 的各种帖子训练模型,之前 Reddit 是免费提供这些数据的。 现在如果开发者利用 API 获取数据并用于商业目的则需要与 Reddit 签订单独的协议,具体怎么收费还得开发者与 Reddit 商务洽谈才能知道。另外 Reddit 还会继续提供免费 API,例如开发者用来构建审核工具或在教育、研究领域使用 Reddit API 则可以继续免费使用。 Reddit 计划在今年晚些时候上市,所以将 API 货币化也是个重要的收入来源,腾讯此前还投资了 Reddit。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

【禁止白嫖】Reddit 今天宣布 API 接口政策变更,限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用

【禁止白嫖】Reddit 今天宣布 API 接口政策变更,限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用于训练 AI 模型的,必须支付相应的费用才可以。Reddit 是目前多数 AI 最重要的训练数据来源之一。 #抽屉IT

封面图片

Reddit 将对使用其论坛数据训练AI的行为收费

Reddit 将对使用其论坛数据训练AI的行为收费 Reddit CEO Steve Huffman 称该平台的语料库非常有价值,他们不再想将其免费提供给科技巨头。Reddit 修改了API访问政策,API对独立开发者以及学术和非盈利项目的研究员仍然免费,但通过其API使用语料库训练AI的行为将开始收费,具体金额在未来几周公布。

封面图片

OpenAI 现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练 AI 模型

OpenAI 现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练 AI 模型 OpenAI 在其博客文章中表示,网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问,或者通过屏蔽其 IP 地址,来阻止 GPTBot 从其网站上抓取数据。 GPTBot是OpenAI的网络爬虫,可以通过以下用户代理和字符串来识别。 User agent token: GPTBot Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot) 禁止 GPTBot User-agent: GPTBot Disallow: / 自定义 GPTBot 访问 User-agent: GPTBot Allow: /directory-1/ Disallow: /directory-2/ IP 出口范围 40.83.2.64/28

封面图片

OpenAI 现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练 AI 模型

OpenAI 现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练 AI 模型 OpenAI 在其博客文章中表示,网站运营者可以通过在其网站的文件中禁止 GPTBot 的访问,或者通过屏蔽其 IP 地址,来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示,“使用 GPTBot 用户代理(user agent)抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高它们的通用能力和安全性。” 但是,这并不会追溯性地从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。来源 ,, 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

美国FTC就Reddit论坛把数据卖给谷歌等公司训练AI发起调查

美国FTC就Reddit论坛把数据卖给谷歌等公司训练AI发起调查 不过 Reddit 直接将用户帖子内容 (数据) 卖给是否合规呢?美国联邦贸易委员会 (FTC) 已经宣布介入调查,FTC 要求 Reddit 提供与客户有关的人工智能交易的信息和文件。需要说明的是目前尚不清楚 FTC 具体因为什么原因宣布调查 Reddit,毕竟 FTC 没透露是卖数据牵涉隐私问题还是其他什么问题。Reddit 在这个 IPO 紧要关口被 FTC 调查绝对不是好事,因为这可能会影响到 Reddit 的 IPO 进程,为此 Reddit 发布了一个非常有意思的回应,这份回应尽可能对 FTC 发起的调查进行轻描淡写,试图减轻投资者的担忧。Reddit 在回应中是这么说的:2024 年 3 月 14 日我们收到 FTC 的一封信,通知我们 FTC 的工作人员正在进行非公开调查,重点关注我们为训练人工智能模型而与第三方销售、许可或共享用户生成的内容。鉴于这些技术和商业安排的新颖性 (指将内容出售给客户训练 AI 模型,这在以前确实是很少见的),联邦贸易委员会对这一领域表示兴趣,我们并不感到惊讶。我们不认为我们参与了任何不公平或欺骗性的贸易行为。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人