反盗版组织将知名AI训练数据集“Books3”下线。

反盗版组织将知名AI训练数据集“Books3”下线。 丹麦反盗版组织Rights Alliance已经下线了知名的“Books3”数据集,该数据集被用来训练包括Meta在内的高知名度AI模型。 出版商代表发送了删除通知,促使“The Eye”移除了这个包含了近20万本书籍的37GB数据集,该数据集已经在其上托管了数年。然而,复制品仍在其他地方出现。 这个数据集包含了来自盗版网站Bibliotik的所有书籍,于2020年末首次在The Eye上,自那以后已被用来训练多个AI模型,包括Meta的模型。 虽然最初且流传最广的 Books3 下载链接现已离线,但该数据集并未完全从网络上消失。Shawn Presser 还提供了新的下载链接:

相关推荐

封面图片

知名电子合同平台DocuSign拿客户签署的机密合同去训练AI

知名电子合同平台DocuSign拿客户签署的机密合同去训练AI 企业不需要使用传统方式打印合同、签订、寄送或者通过传真方式发送,使用 DocuSign 平台这种商务领域的东西确实可以被简化。使用 OpenAI 的 GPT 模型:DocuSign 称该公司选择与微软合作,使用微软在云端提供的 OpenAI GPT 模型,也就是 Microsoft Azure OpenAI 服务。使用 GPT 模型是用来帮助 DocuSign 训练自己的内部 AI,而微软那边则向 DocuSign 承诺此类企业级 AI 服务不会收集客户的数据拿去训练 GPT。DocuSign 内部 AI:该公司还使用客户提交的各种数据来训练 DocuSign 内部专有的 AI,内部专有的 AI 指的是不会公开发布的那种 AI。当然按惯例这是要取得用户同意的,然而这些选项似乎都放在使用协议里,估计大多数用户也没仔细阅读使用协议就已经同意。另一方面 DocuSign 强调使用客户的数据会先进行匿名化和去识别化,也就是这数据无法归因到特定的人或企业,以此来保证数据安全。但这种话说出来也就听听而已,毕竟合同这类数据,有些是具有独特文本内容的,这些内容本身就不应该被泄露。最后,DocuSign 没有提供如何退出数据被拿去训练 AI 的选项。 ... PC版: 手机版:

封面图片

【RSS3将发布AI开放平台,为开发者提供训练链上数据的GPT模型环境】

【RSS3将发布AI开放平台,为开发者提供训练链上数据的GPT模型环境】 3月19日消息,OpenWeb信息分发协议RSS3将发布面向开发者的Web3AI开放平台,为开发者提供训练链上数据的GPT模型的环境。基于此环境训练的模型将拥有对去中心化网络中数据和信息的获取、处理、与思考能力。范围涵盖且不局限于DeFi、NFT、去中心化社交等领域。此前,RSS3生态内首款面向C端用户的搜索引擎产品hoot.it已上线基于GPT的HootGPT,可以为用户提供独特、自然和互动的搜索体验。

封面图片

微软、OpenAI等公司已使用合成数据来训练AI模型

微软、OpenAI等公司已使用合成数据来训练AI模型 金十数据7月20日讯,人工智能初创公司Cohere首席执行官AidenGomez表示,由于Reddit、推特等公司的数据采集要价太高,微软、OpenAI和Cohere等公司,已使用合成数据来训练AI模型。Gomez表示,合成数据可以适用于很多训练场景,只是目前尚未全面推广。 来源:https://flash.jin10.com/detail/20230720104640322100 via 匿名 标签: #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

美众议员提出新法案:AI 公司应当披露受版权保护训练数据使用情况

美众议员提出新法案:AI 公司应当披露受版权保护训练数据使用情况 该法案要求在 AI 模型在向消费者提供之前 30 天内,需要向版权局提交该模型训练数据集中受版权保护作品的完整清单。当现有模型的训练数据集“发生重大改变”时,也必须及时向版权局提交。对违规行为的经济处罚将由版权局根据公司的违规历史和公司规模等因素,逐案作出决定。

封面图片

巴西禁止 Meta 用该国用户数据训练 AI 模型

巴西禁止 Meta 用该国用户数据训练 AI 模型 巴西国家数据保护机构周二裁定,Meta 须停止使用该国用户数据训练其 AI 模型。Meta 此前更新隐私政策,声明将使用用户公开发表的帖子训练 AI 模型。巴西监管机构担心儿童与朋友和家人分享的个人数据可能会被以无法预料的方法对他们造成伤害。里约热内卢智库 Institute of Technology and Society 的 Ronaldo Lemos 认为,巴西此举可能会鼓励其它科技公司在使用个人数据方面维持不透明的状态,因为 Meta 是唯一一家提前通知使用个人数据训练 AI 的科技巨头,结果却因此受到严厉惩罚。Meta 收到通知后需要在五天内证明合规,否则每天面临 5 万雷亚尔的罚款。Meta 发言人对巴西的裁决表达了失望。 via Solidot

封面图片

巴西禁止 Meta 用该国用户数据训练 AI 模型

巴西禁止 Meta 用该国用户数据训练 AI 模型 巴西国家数据保护机构周二裁定,Meta 须停止使用该国用户数据训练其 AI 模型。Meta 此前更新隐私政策,声明将使用用户公开发表的帖子训练 AI 模型。巴西监管机构担心儿童与朋友和家人分享的个人数据可能会被以无法预料的方法对他们造成伤害。里约热内卢智库 Institute of Technology and Society 的 Ronaldo Lemos 认为,巴西此举可能会鼓励其它科技公司在使用个人数据方面维持不透明的状态,因为 Meta 是唯一一家提前通知使用个人数据训练 AI 的科技巨头,结果却因此受到严厉惩罚。Meta 收到通知后需要在五天内证明合规,否则每天面临 5 万雷亚尔的罚款。Meta 发言人对巴西的裁决表达了失望。来源 , 频道:@kejiqu 群组:@kejiquchat

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人