Google 更新隐私政策将抓取所有 Web 内容训练 AI

Google 更新隐私政策将抓取所有 Web 内容训练 AI Google 于 7 月 1 日更新了它的隐私政策，其中包括保留权利抓取公开 Web 内容训练 AI。Google 在新版隐私政策中称，“我们可能会收集网络上可公开访问的信息或其它公共来源的信息去帮助训练 Google 的 AI 语言模型，构成产品和功能如 Google Translate、Bard 和 Cloud AI。”整个互联网正成为搜索巨人的 AI 游乐场。来源，，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

Meta更新隐私政策用户在FB/Ins上发布的内容将被用于训练AI

Meta更新隐私政策用户在FB/Ins上发布的内容将被用于训练AI Facebook 和 Instagram 母公司 Meta 日前开始向用户发布新的隐私权政策，根据新版隐私权政策，用户将同意将自己发布的任何内容用于 AI at Meta 模型训练。新的隐私权政策将在 2024 年 6 月 26 日生效，如果用户反对该隐私权政策则应该停止使用 Facebook 和 Ins 等产品，否则均为接受新政策，即用户数据可以用于训练模型。哪些数据会被用于 AI 模型训练：应该说哪些数据不会被用于 AI 模型训练，除了用户与好友之间的私密消息内容外，其他数据及衍生数据均会被用于模型训练。例如用户在 Facebook 上发布的图片和文字内容、在 INS 上发布的图片、好友或其他用户发布的评论、用户在其他帖子中发布的评论、这些数据经过 Meta 处理后产生的分析数据等。因此除了私密消息外其他所有数据都会被用于训练，除非用户停止使用 FB 和 INS 等产品，否则产生的数据就会用于训练。估计其他公司也会跟进此类措施：对社交媒体平台来说用户数据就是最大的宝藏，例如埃隆马斯克的 xAI 就主要使用 X/Twitter 上的数据进行训练，xAI 还可以实时抓取 X/Twitter 上的数据。谷歌则使用 YouTube 视频库作为训练材料之一，即谷歌开发 AI 将视频转录为文字内容，然后再将文字内容拿去训练 AI。其他任何拥有大量数据的公司后续应该都会更新隐私政策要求用户同意将数据用于模型训练，尽管这不会给用户产生任何收益。 ... PC版：手机版：

Google、Snap、Meta等科技公司都在悄悄改变隐私政策以便进行AI训练

Google、Snap、Meta等科技公司都在悄悄改变隐私政策以便进行AI训练今年早些时候，美国联邦贸易委员会曾警告说，如果公司修改隐私声明的条款和条件，允许它们使用客户的数据来训练人工智能模型，那么它们将受到极大的诱惑。该委员会说，为了避免担心隐私的用户的反弹，公司可能会试图悄悄地、大张旗鼓地做出这些改变。然而，这种行为是非法的，委员会补充说，任何违背用户隐私承诺的公司都有触犯法律的风险。该委员会明确指出："如果一家公司采取更宽容的数据做法例如，开始与第三方共享消费者数据或将这些数据用于人工智能训练而只是通过偷偷摸摸、追溯性地修改其服务条款或隐私政策来告知消费者这一变化，这可能是不公平或具有欺骗性的。"但根据《纽约时报》的分析，这正是正在发生的事情。随着公司寻求数据来训练其人工智能模型，它们越来越多地转向受隐私法保护的数据。为了给自己提供法律保障，它们正在精心改写条款和条件，加入"人工智能"、"机器学习"和"生成式人工智能"等术语。Google就是一个例子。去年 7 月，Google对其隐私政策进行了几处重要调整。现在，该政策规定，Google使用公开信息来帮助训练其语言人工智能模型，并开发Google翻译、Bard（现为双子座）和云人工智能功能等产品。Google对《纽约时报》解释说，这一改动"只是澄清了较新的服务，如 Bard（现在的双子座）也包括在内。我们并没有因为这一语言变化而开始在更多类型的数据上训练模型"。上个月，Adobe 也采取了类似的行动，但却遭到了用户的强烈反对。一个弹出式窗口通知用户进行更新，暗示该公司可以访问用其创意套件创建的内容并要求所有权，以训练人工智能模型等。许多用户对此非常愤怒，尤其是当他们意识到，如果不立即同意这些令人困惑的新条款，就无法访问自己的项目。这导致了一波取消订阅的浪潮，并迫使 Adobe 就更新后的条款做出澄清。今年 5 月，Meta 通知其在欧洲的 Facebook 和 Instagram 用户，它将使用公开发布的帖子来训练其人工智能。然而，在欧洲 11 个国家的欧洲数字权利中心（European Center for Digital Rights）提出投诉后，Meta 暂停了这些计划。由于消费者保护措施较弱，以及包括美国联邦贸易委员会在内的州和联邦监督机构错综复杂，Meta 更容易收集美国用户的数据。随着越来越多的隐私政策被修改以纳入人工智能数据训练，该委员会将采取什么行动还有待观察。 ... PC版：手机版：

WPS 道歉并更新隐私政策明确不将用户文档用于 AI 训练

WPS 道歉并更新隐私政策明确不将用户文档用于 AI 训练据之前媒体报道，WPS 在 11 月 13 日更新了《隐私协议》，其中提到“我们将对您主动上传的文档材料，在采取脱敏处理后作为 AI 训练的基础材料使用”。当时有网友担心 WPS 使用用户上传文档训练 AI 会造成隐私泄漏。昨日，WPS 官方微博发文，对近期用户反映的问题表达歉意，并表示“我们已经更新了《WPS隐私政策》，去除了容易引起误解的表述，并确保其内容与我们的实际操作严格对应”。 WPS 官方郑重声明，所有用户文档不会被用于任何 AI 训练目的，也不会在未经用户同意的情况下用于任何场景。并重申，WPS 始终严格遵守所有可适用的用户隐私保护法律和标准。

【禁止白嫖】Reddit 今天宣布 API 接口政策变更，限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用

【禁止白嫖】Reddit 今天宣布 API 接口政策变更，限制开发者利用 API 抓取 Reddit 训练 AI 模型。如果是用于训练 AI 模型的，必须支付相应的费用才可以。Reddit 是目前多数 AI 最重要的训练数据来源之一。 #抽屉IT

谷歌承诺不会拿Google Docs训练AI 除非文档是公开共享的

谷歌承诺不会拿Google Docs训练AI 除非文档是公开共享的谷歌称如果一份谷歌文档已经被设置为公开共享，那么意味着互联网上的各种爬虫都可以抓取该内容，既然如此那么谷歌也可以抓取，那么就可能会被用来训练 AI。所以关键问题在于文档是私有的还是公开的，一旦文档设置为公开的那就不存在私密性可言，所以被用来训练也是正常的。Google Docs 目前提供三种共享模式，包括输入电子邮件向特定用户共享、通过链接公开共享和在企业内部共享 (第三种仅限于企业版)，除了第二种链接公开共享外，其他都是私密共享，都不会被谷歌抓取。这个回应也算是解释了这段时间有些谣言称谷歌会拿用户在 Google Drive 里存储的文件或文档进行训练的说法，所以继续使用 Google Docs 或 Google Drive 无需担心这些问题。 ... PC版：手机版：

OpenAI 现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型

OpenAI 现允许网站阻止其网络爬虫抓取数据，避免数据被用于训练 AI 模型 OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示，“使用 GPTBot 用户代理（user agent）抓取的网页可能会被用于改进未来的模型，并且会过滤掉那些需要付费访问、已知收集个人身份信息（PII）、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源，“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确，并提高它们的通用能力和安全性。” 但是，这并不会追溯性地从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。来源，，频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人