Google 更新隐私政策将抓取所有 Web 内容训练 AI

Google更新隐私政策将抓取所有Web内容训练AIGoogle于7月1日更新了它的隐私政策，其中包括保留权利抓取公开Web内容训练AI。Google在新版隐私政策中称，“我们可能会收集网络上可公开访问的信息或其它公共来源的信息去帮助训练Google的AI语言模型，构成产品和功能如GoogleTranslate、Bard和CloudAI。”整个互联网正成为搜索巨人的AI游乐场。来源，，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

在Telegram中查看

相关推荐

Google的政策更新：你发布的所有内容都将被用于AI训练

Google的政策更新：你发布的所有内容都将被用于AI训练Google上周末的更新为其隐私政策引入了新的措辞。它以前说过，人们的数据将被用于训练"语言"模型，只提到了Google翻译。更新后的版本将其改为"人工智能模型"，特别提到了与翻译一起的巴德和云人工智能。ChatGPT和Bard等生成性人工智能系统的许多有争议的问题之一是它们收集和使用数据的方式。虽然它可能是公开的信息，但这并不能阻止抄袭和隐私问题，更不用说人工智能有可能曲解所说的内容或提供过时的旧答案。甚至Google也警告员工，在使用像它自己的Bard这样的聊天机器人时要谨慎，因为它们可能会提出不受欢迎的代码建议。还有一个问题是，这种数据采集是否合法。ChatGPT的创造者OpenAI正面临诉讼，因为它被指控非法收集互联网用户的个人信息，并使用这些数据来创造其产品。OpenAI还在处理关于侵犯版权和侵犯隐私的诉讼，该诉讼声称它未经许可使用有版权的书籍来训练其人工智能系统。据称，该公司从这些书籍中非法复制文本，没有获得版权所有者的同意，也没有给予他们补偿。对于埃隆-马斯克来说，数据采集似乎是一个特别令人困扰的话题。上周末，Twitter暂时限制了账户每天可以阅读的推文数量，据称是为了解决平台上"极端水平"的数据采集和"系统操纵"--尽管并非所有人都认同这是施加限制的原因。自从关闭对其API的免费访问以阻止数据采集以来，Reddit也面临着一连串的麻烦。此举导致超过8000个子版块关闭以示抗议。...PC版：https://www.cnbeta.com.tw/articles/soft/1369021.htm手机版：https://m.cnbeta.com.tw/view/1369021.htm

科技巨头悄然变更隐私政策以支持AI训练

科技巨头悄然变更隐私政策以支持AI训练一些大型科技公司，如Google、Snap和Meta，正在悄悄更改他们的隐私政策，以便使用用户数据训练人工智能模型。这种做法可能违法，因为美国联邦贸易委员会（FTC）已经警告，公司不应在不通知用户的情况下更改隐私条款。例如，Google在去年对其隐私政策进行了调整，声称使用公开信息来训练其语言AI模型，并开发如GoogleTranslate、Bard（现更名为Gemini）和CloudAI等产品。Adobe也采取了类似行动，但由于用户反馈，不得不发布澄清。Meta曾计划使用公开帖子来训练其AI，但在欧洲数字权利中心的投诉后暂停了这些计划。随着隐私政策的不断变化，监管机构可能需要采取行动来应对这些挑战，确保用户隐私得到妥善保护。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

Meta更新隐私政策用户在FB/Ins上发布的内容将被用于训练AI

Meta更新隐私政策用户在FB/Ins上发布的内容将被用于训练AIFacebook和Instagram母公司Meta日前开始向用户发布新的隐私权政策，根据新版隐私权政策，用户将同意将自己发布的任何内容用于AIatMeta模型训练。新的隐私权政策将在2024年6月26日生效，如果用户反对该隐私权政策则应该停止使用Facebook和Ins等产品，否则均为接受新政策，即用户数据可以用于训练模型。哪些数据会被用于AI模型训练：应该说哪些数据不会被用于AI模型训练，除了用户与好友之间的私密消息内容外，其他数据及衍生数据均会被用于模型训练。例如用户在Facebook上发布的图片和文字内容、在INS上发布的图片、好友或其他用户发布的评论、用户在其他帖子中发布的评论、这些数据经过Meta处理后产生的分析数据等。因此除了私密消息外其他所有数据都会被用于训练，除非用户停止使用FB和INS等产品，否则产生的数据就会用于训练。估计其他公司也会跟进此类措施：对社交媒体平台来说用户数据就是最大的宝藏，例如埃隆马斯克的xAI就主要使用X/Twitter上的数据进行训练，xAI还可以实时抓取X/Twitter上的数据。谷歌则使用YouTube视频库作为训练材料之一，即谷歌开发AI将视频转录为文字内容，然后再将文字内容拿去训练AI。其他任何拥有大量数据的公司后续应该都会更新隐私政策要求用户同意将数据用于模型训练，尽管这不会给用户产生任何收益。...PC版：https://www.cnbeta.com.tw/articles/soft/1433263.htm手机版：https://m.cnbeta.com.tw/view/1433263.htm

X（推特）更新服务条款：禁止第三方抓取数据来培训 AI 模型

X（推特）更新服务条款：禁止第三方抓取数据来培训AI模型X公司（推特）日前更新了服务条款，在未经许可的前提下，任何第三方都不得在X平台上抓取数据来培训人工智能（AI）模型。该条款将于9月29日起生效。根据新条款，未经事先书面许可，无论出于何种目的，都不得在X平台上进行任何形式的数据抓取行为。而之前，X公司允许外界通过robots.txt文件对平台数据进行抓取。在禁止第三方抓取的同时，X本月早些时候也曾调整隐私政策，允许X使用用户发布的信息来训练其人工智能模型。马斯克称，X只会使用公开的信息来训其练人工智能模型，不会使用任何私有的内容。来源，频道：@kejiqu群组：@kejiquchat

WPS 道歉并更新隐私政策明确不将用户文档用于 AI 训练

WPS道歉并更新隐私政策明确不将用户文档用于AI训练据之前媒体报道，WPS在11月13日更新了《隐私协议》，其中提到“我们将对您主动上传的文档材料，在采取脱敏处理后作为AI训练的基础材料使用”。当时有网友担心WPS使用用户文档训练AI会泄漏隐私。昨日，WPS官方微博发文，对近期用户反映的问题表达歉意，并表示“我们已经更新了《WPS隐私政策》，去除了容易引起误解的表述，并确保其内容与我们的实际操作严格对应”。WPS官方郑重声明，所有用户文档不会被用于任何AI训练目的，也不会在未经用户同意的情况下用于任何场景。并重申，WPS始终严格遵守所有可适用的用户隐私保护法律和标准。——

Google为内容供应商提供了一个开关使其可以选择不成为AI训练数据

Google为内容供应商提供了一个开关使其可以选择不成为AI训练数据该公司称，Google-Extended将让发布商"管理其网站是否有助于改进Bard和VertexAI生成API"，并补充说，网络发布商可以使用切换键"控制对网站内容的访问"。Google今年7月证实，它正在利用从网上搜刮的公开数据训练其人工智能聊天机器人Bard。Google-Extended可通过robots.txt（网站根目录的文本文件，用于告知网络爬虫是否可以访问某些网站）使用。Google指出，"随着人工智能应用的扩展"，它将继续探索"更多机器可读的方法，为网络发布者提供选择和控制"，并将很快分享更多信息。目前，许多网站已经开始屏蔽OpenAI用来抓取数据和训练ChatGPT的网络爬虫，其中包括《纽约时报》、CNN、路透社和Medium。不过，如何屏蔽Google一直是个问题。毕竟，网站不能完全关闭Google的爬虫，否则就无法在搜索中被收录。这使得《纽约时报》等一些网站通过更新服务条款，禁止公司使用其内容训练人工智能，从而从法律上封杀Google。...PC版：https://www.cnbeta.com.tw/articles/soft/1387003.htm手机版：https://m.cnbeta.com.tw/view/1387003.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人