【禁止白嫖】Reddit 今天宣布 API 接口政策变更，限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用

【禁止白嫖】Reddit 今天宣布 API 接口政策变更，限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用于训练 AI 模型的，必须支付相应的费用才可以。Reddit 是目前多数 AI 最重要的训练数据来源之一。 #抽屉IT

在Telegram中查看

相关推荐

Reddit不再给AI公司免费提供数据

Reddit不再给AI公司免费提供数据 Reddit 是目前多数 AI 最重要的训练数据来源之一，包括 ChatGPT 和 Bard 等都使用 Reddit 的各种帖子训练模型，之前 Reddit 是免费提供这些数据的。现在如果开发者利用 API 获取数据并用于商业目的则需要与 Reddit 签订单独的协议，具体怎么收费还得开发者与 Reddit 商务洽谈才能知道。另外 Reddit 还会继续提供免费 API，例如开发者用来构建审核工具或在教育、研究领域使用 Reddit API 则可以继续免费使用。 Reddit 计划在今年晚些时候上市，所以将 API 货币化也是个重要的收入来源，腾讯此前还投资了 Reddit。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

Reddit 推出付费 API 服务，授权给第三方训练 AI

Reddit 推出付费 API 服务，授权给第三方训练 AI 美国著名论坛网站 Reddit 准备有偿提供其庞大的文字数据给Google 和 OpenAI等第三方人工智能公司，帮助他们训练 AI 模型。 Reddit 希望利用这一数据富矿实现商业收益，并为不同规模的公司提供分级服务。Reddit 上的对话数据更有助于赋予聊天机器人「人性」。 Reddit 创始人兼 CEO Steve Huffman 表示，Reddit 的数据极具价值。为了避免被滥用，Reddit 可能会关闭部分现有的 API，转成付费 API。这对于计划年内上市的 Reddit 而言，这部分潜在巨大利润将有助于提高公司估值。

Google 更新隐私政策将抓取所有 Web 内容训练 AI

Google 更新隐私政策将抓取所有 Web 内容训练 AI Google 于 7 月 1 日更新了它的隐私政策，其中包括保留权利抓取公开 Web 内容训练 AI。Google 在新版隐私政策中称，“我们可能会收集网络上可公开访问的信息或其它公共来源的信息去帮助训练 Google 的 AI 语言模型，构成产品和功能如 Google Translate、Bard 和 Cloud AI。”整个互联网正成为搜索巨人的 AI 游乐场。来源，，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

：开源大模型的统一后端接口，支持多种开源大模型

：开源大模型的统一后端接口，支持多种开源大模型该项目为开源大模型的推理实现统一的接口接口，与OpenAI响应保持一致，具有以下特性：以OpenAI ChatGPT API这样的方式调用开源分布式大模型支持流式响应，实现打印机效果实现文本嵌入模型，为文档知识问答提供支持支持大规模语言模型开发工具langchain 的广泛功能要简单的修改环境变量即可将开源模型作为chatgpt的替代模型，为大众应用提供反馈支持支持加载经过自行训练的lora模型

OpenAI 已经签署了一项协议，可以实时访问 Reddit 的数据 API，这意味着它可以在 ChatGPT 和其他新产品中展

OpenAI 已经签署了一项协议，可以实时访问 Reddit 的数据 API，这意味着它可以在 ChatGPT 和其他新产品中展示该网站的讨论内容。这份协议与 Reddit 今年早些时候与 Google 签订的协议类似，据报道价值 6000 万美元。这项协议还将“让 Reddit 能够为 Redditors 和版主带来新的 AI 驱动功能”，并利用 OpenAI 的大型语言模型来开发应用程序。OpenAI 也已同意成为 Reddit 的广告合作伙伴。 2023 年 6 月，超过 7000 个子版块因为用户抗议 Reddit 调整 API 定价而暂时关闭。最近，在 OpenAI 与编程交流平台 Stack Overflow 宣布合作之后，一些人在尝试删除自己的帖子后被暂停了账号。在宣布这项安排的中，并没有透露任何财务条款，两家公司也都没有提到培训数据。这与与谷歌的交易不同，在那次交易中，Reddit 明确表示它将为谷歌提供“更有效的模型训练方式”。不过，有一项披露声明提到 OpenAI 的首席执行官 Sam Altman 也是 Reddit 的股东，但“这次合作是由 OpenAI 的首席运营官领导，并得到了其独立董事会的批准。” “Reddit 已经成为互联网上最大的开放式档案库之一，这里有关于任何事情的真实、相关且始终更新的人类对话。将其纳入 ChatGPT 体现了我们对互联网连接性的信念，帮助人们更容易找到他们所寻求的内容，同时也让新的用户群体在 Reddit 上找到归属感。”Reddit 的 CEO Steve Huffman 表示。 Reddit 并不总是对那些抓取其数据来训练AI模型的公司持友好态度。它曾威胁要阻止谷歌的网络爬虫访问其网站。据报道，OpenAI 还告诉 r/ChatGPT 的版主们，他们使用 ChatGPT 的标志作为展示图片侵犯了 OpenAI 的版权。标签: #OpenAI #Reddit #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

OpenAI 现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型

OpenAI 现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型 OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示，“使用 GPTBot 用户代理（user agent）抓取的网页可能会被用于改进未来的模型，并且会过滤掉那些需要付费访问、已知收集个人身份信息（PII）、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源，“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确，并提高它们的通用能力和安全性。” 但是，这并不会追溯性地从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。来源，，频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人