Reddit向AI搜索爬虫发出侵权警告

Reddit向AI搜索爬虫发出侵权警告 该公司表示,它还将继续阻止和限制未与该公司事先达成协议的爬虫和其他机器人。该公司表示,这些变化不会影响"善意的行为者",如互联网档案馆和研究人员。Reddit 的这一通知是在多方报道 Perplexity 和其他人工智能公司经常绕过robots.txt协议,该协议被出版商用来告诉网络爬虫他们不希望其内容被访问。Perplexity 的首席执行官最近在一次采访时说该协议"不是一个法律框架"。Reddit 发言人在一份声明中表示,这并不是针对某家公司。该发言人说:"这次更新并不是针对某个实体,而是为了保护 Reddit,同时保持互联网的开放性。在接下来的几周里,我们将更新 robots.txt 说明,尽可能明确:如果你使用自动代理访问 Reddit,无论你是哪类公司,你都需要遵守我们的条款和政策,并与我们沟通。我们相信开放的互联网,但我们不相信对公共内容的滥用。"这已经不是该公司第一次在数据访问方面采取强硬立场了。该公司在开始对其 API 收费时,就提到了人工智能公司使用其平台的情况。 API收费时,该公司提到了人工智能公司使用其平台的情况。此后,该公司与一些人工智能公司达成了许可协议,其中包括 Google和 OpenAI.这些协议允许人工智能公司在 Reddit 的档案中训练自己的模型,这也是新近上市的 Reddit 的重要收入来源。这句话中的"和我们谈谈"部分很可能是在不露声色地提醒人们,Reddit 已经不再是一家免费提供内容的公司了。 ... PC版: 手机版:

相关推荐

封面图片

Reddit 更新 robots.txt 文件 加强爬虫限制

Reddit 更新 robots.txt 文件 加强爬虫限制 社交平台 Reddit 周二宣布,在接下来的几周内,将更新其机器人排除协议 (robots.txt 文件),该协议提供有关该平台如何允许和不允许第三方抓取 Reddit 内容的高级说明。除了更新 robots.txt 文件外,Reddit 还将继续对未知的机器人和抓取工具访问该平台网站进行速率限制和/或阻止。此更新不应影响绝大多数使用和享受 Reddit 的用户。善意的行为者,如研究人员和互联网档案馆等组织,仍将能够出于非商业目的访问 Reddit 内容。

封面图片

Reddit 在 IPO 前签署人工智能内容许可协议

Reddit 在 IPO 前签署人工智能内容许可协议 据知情人士透露,Reddit Inc. 已与一家大型人工智能公司达成了一项丰厚的协议,允许其使用社交媒体平台的内容来训练其模型。该公司即将启动期待已久的首次公开募股。知情人士称,这家总部位于旧金山的公司在 IPO 中告诉潜在投资者,该公司已于今年早些时候签署了该协议,该交易的年化价值约为6000万美元。其中一位人士说, Reddit 与一家未具名的大型人工智能公司签订的协议可能成为未来类似性质合同的范本。

封面图片

《纽约时报》封杀 OpenAI 的网络爬虫

《纽约时报》封杀 OpenAI 的网络爬虫 《纽约时报》屏蔽了 OpenAI 的网络爬虫,这意味着 OpenAI 无法使用该出版物的内容来训练其人工智能模型。 如果你查看《纽约时报》的 robots.txt 页面,就会发现《纽约时报》禁止使用 OpenAI 本月早些时候推出的爬虫 GPTBot。根据互联网档案馆的 Wayback Machine,纽约时报似乎早在 8 月 17 日就屏蔽了该爬虫。 这一变化是在《纽约时报》本月初更新其服务条款以禁止使用其内容来训练人工智能模型之后发生的。据报道,《纽约时报》还在考虑对 OpenAI侵犯知识产权的行为采取法律行动。 此前莎拉·西尔弗曼和另外两位作家在 7 月份就 OpenAI 使用 Books3 训练 ChatGPT 而起诉该公司,Books3 是一个用于训练 ChatGPT 的数据集,可能包含数千部受版权保护的作品,还有一位程序员兼律师马修·巴特里克指控该公司的数据抓取行为构成软件盗版侵权。

封面图片

Reddit 推出可搜索该平台的 AI 工具

Reddit 推出可搜索该平台的 AI 搜索工具 ​Reddit 正在推出一款名为 Reddit Answers 的全新人工智能搜索工具,帮助用户更轻松地在平台上查找信息。该工具与其他人工智能搜索产品类似,通过生成格式良好的响应并显示其来源的链接来响应查询。但 Reddit Answers 的不同之处在于直接从 Reddit 获取信息,这意味着可以跳过谷歌直接从源头获取信息。Reddit 此前已严格限制爬虫对平台内容的访问,目前谷歌搜索是唯一能显示最新 Reddit 结果的主要搜索引擎。但 Reddit 可能更希望用户直接在其平台上进行搜索,而 Reddit Answers 可能是种很好的方式。该工具最初将面向美国和英语地区的“有限数量用户”推出,并将在网页和 iOS 上提供。 TheVerge-电报频道- #娟姐新闻:@juanjienews

封面图片

OpenAI 签署协议以 Reddit 数据训练人工智能

OpenAI 签署协议以 Reddit 数据训练人工智能 人工智能公司 OpenAI 已与 Reddit 达成协议,使用该社交新闻网站的数据来训练人工智能模型。OpenAI 表示,与 Reddit 的合作将使其能够访问 Reddit 上的“实时、结构化和独特内容” (例如帖子和回复),从而使其工具和模型能够“更好地理解和展示”这些内容。Reddit 的内容将被整合到 OpenAI 流行的对话式人工智能 ChatGPT 中,双方将合作为 Reddit 用户和版主带来未具体说明的新“人工智能功能”。OpenAI 也将成为 Reddit 的广告合作伙伴。

封面图片

“美版贴吧”Reddit上市前签署AI内容授权协议

“美版贴吧”Reddit上市前签署AI内容授权协议 有知情人士表示,这家总部位于旧金山的公司告诉一些潜在投资者,它已于今年早些时候签署了这笔按年计算价值约6,000万美元的重磅协议。知情人士表示,Reddit与一家未具名的大型人工智能科技公司达成的协议,可能成为未来类似性质合同的典范。随着ChatGPT和谷歌的Bard等以消费者应用为中心的生成式人工智能(AI)工具接连问世,全球开始迈入AI时代,现代化的人工智能程序开始使用大型语言模型,在海量的网络内容上训练人工智能系统,其中的数据内容包括推特(被马斯克收购后改名为X社交平台)和Reddit等网站上用户生成的帖子。在去年,Reddit曾公开要求开发者支付数千美元才能直接访问该公司的数据和内容,此举可能有助于该公司构建更多元化的营收来源。据不完全统计,每日有千万级别用户涌入Reddit发帖、浏览、转发文章,这些内容包括但不限于政治、经济、体育、娱乐、生活、美食等等,这些内容共同构建起巨大的数据库。知情人士表示,Reddit去年的营收规模超过8亿美元,比2022年的数字增长了大约20%。从席卷全球科技企业的人工智能浪潮中获利的能力,可能有助于Reddit利用全球投资者对这项革新性的技术的投资热情,进而推动其整体估值以及IPO规模。有媒体报道称,有华尔街投资机构建议该公司考虑至少50亿美元的IPO规模,并建议最早于下个月正式启动IPO。据媒体今年早些时候的报道,以摩根士丹利和高盛集团为首的约16家华尔街投行正在筹备此次IPO;参与此项交易的其他投资银行可能还包括摩根大通、美国银行和花旗集团等。知情人士表示,Reddit内部围绕IPO的讨论仍在进行中,上市计划以及与AI货币化有关的细节都可能发生变化。Reddit的一位代表拒绝就媒体援引的知情人士消息进行置评。渴望获得海量社交媒体数据来训练自己的AI应用软件的人工智能公司,一直在与渴望获得新营收来源的内容提供商达成训练数据许可协议。据媒体此前报道,风靡全球的ChatGPT开发商的OpenAI去年12月与德国媒体行业巨头阿克塞尔·施普林格公司(Axel Springer SE)达成了一项价值数千万美元的人工智能数据训练合同。据媒体报道,ChatGPT文本生成工具背后的这家AI初创公司同时也在与包括CNN、福克斯公司和时代周刊在内的知名新闻出版商进行谈判,以获得他们的数据训练许可,为其人工智能聊天机器人ChatGPT提供更多的训练数据,使其响应的结果更加精确、更相关、更及时。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人