NVIDIA 用语言资料库训练 AI 系统 NeMo 美作家控侵害著作权

NVIDIA用语言资料库训练AI系统NeMo美作家控侵害著作权https://www.cna.com.tw/news/aopl/202403110139.aspx路透社报导，祁恩（BrianKeene）、纳兹米（AbdiNazemian）和欧南（StewartO'Nan）3名作家表示，辉达用于训练NeMo普通书写语言的资料库约有19万6640本书籍，当中就有他们的作品，直到去年10月才因涉及侵权而将他们的作品撤掉。

在Telegram中查看

相关推荐

中央社辉达用语言资料库训练AI系统NeMo美作家控侵害著作权

“ChatGPT之父”：OpenAI早已不使用客户数据来训练模型

“ChatGPT之父”：OpenAI早已不使用客户数据来训练模型OpenAI是近期爆火的AI聊天机器人ChatGPT的开发商，而阿尔特曼提到的“大语言模型”就是ChatGPT背后的关键技术。据了解，开发商在训练大语言模型时需要摄取网络上的海量数据，才能提高模型生成自然语言的能力。阿尔特曼在专访中说道，“用户们显然希望我们不要使用他们的数据进行训练，所以我们已经改变了我们的计划，未来我们也不会这样做了。”网络记录也显示，今年3月1日，OpenAI悄然更新了其服务条款：“不会使用通过其API提交的任何数据来‘服务改进’，包括AI模型训练，除非客户或组织选择加入。”此外，该公司同时添加了30天的数据保留政策，API用户可以选择“根据用户需求”进行更严格的保留，并简化其条款和数据所有权，以明确用户拥有模型的输入和输出。鉴于新的隐私规则仅适用于API用户，这也意味着，普通用户和ChatGPT之间的对话内容，只要用户切换“关闭聊天记录”按钮，仍会进入到模型的训练资料库。长期以来，开发人员一直对OpenAI先前的数据处理政策颇有异议，声称这会带来隐私风险并允许公司从他们的数据中获利。目前，亚马逊等公司已经颁布了禁止员工分享敏感数据的措施，以防范ChatGPT这样的大语言模型窃取公司机密。另有消息称，三星电子本周也推出了一项新政策，要求员工不得在工作场所使用ChatGPT等生成式人工智能。此前，该公司的半导体业务部门曝出了三起机密资料外泄案件，其中两起与半导体设备有关的文件可能已经录入到ChatGPT的学习资料库中。本周早些时候，美国作家协会（WGA）与电影公司之间为期六周的合同谈判破裂，好莱坞面临15年来首次编剧罢工。而究其原因，是美国作家协会要求限制人工智能编写电影和电视剧剧本。美国作家协会谈判委员会成员JohnAugust表示，编剧对人工智能主要有两个不满：他们不想让自己的作品成为“喂饱”AI的材料，也不想以后只能修改AI草率的初稿。...PC版：https://www.cnbeta.com.tw/articles/soft/1358383.htm手机版：https://m.cnbeta.com.tw/view/1358383.htm

Getty开发的人工智能生成器只对拥有版权图片的进行训练

Getty开发的人工智能生成器只对拥有版权图片的进行训练GettyImages的GenerativeAI仅在庞大的GettyImages图库（包括高级内容）上进行训练，用户可获得完全的版权保护。盖蒂公司承诺，这意味着任何使用该工具并将其创建的图片进行商业发布的人都将受到法律保护。盖蒂公司与NVIDIA合作，使用NVIDIA的生成式人工智能模型库Picasso上的Edify模型。该公司表示，使用该工具创建的任何照片都不会被收录到GettyImages和iStock的内容库中。如果使用创作者的人工智能生成图像来训练当前和未来版本的模型，盖蒂公司将向创作者支付报酬。它将分享该工具产生的收入，"按比例分配每个文件的份额和基于传统许可收入的份额"。盖蒂图片公司首席产品官格兰特-法豪尔（GrantFarhall）在一份声明中说："我们倾听了客户对生成式人工智能迅猛发展的意见--既有兴奋也有犹豫--并尝试有意识地开发我们自己的工具。"Getty工具限制了用户可以生成的图片类型。它不允许我创建一张乔-拜登在白宫前的照片，或者一只安迪-沃霍尔或杰夫-昆斯风格的猫。任何带有真实人名的提示都被禁止。在要求创建美国总统的图片时，我看到了美国国旗前的男女照片，其中一些还是有色人种。该模型"不知道谁是安迪-沃霍尔（AndyWarhol）、乔-拜登（JoeBiden）或任何其他现实世界中的人"，因为它不想操纵或再现现实生活中的事件。用户可以通过GettyImages网站访问GettyImages的GenerativeAI。该公司表示，该工具将与标准的GettyImages订阅分开定价，定价基于提示量。不过，该公司没有具体说明价格。盖蒂图片公司表示，用户将获得他们所创作图片的永久、全球和无限版权。(尽管如此，人工智能生成的图片在技术上的版权地位仍然模糊不清）。盖蒂公司表示，这类似于客户从其资料库中获得内容授权，公司拥有文件所有权，但授权用户使用。用户可以编写自己的提示，也可以使用提示生成器来指导自己。用户还可以通过API将该工具集成到自己的工作流程中。按照惯例，盖蒂公司会在通过该工具创建的照片上打上水印，以识别照片是由人工智能生成的。盖蒂公司涉足人工智能图片领域并不奇怪，毕竟它拥有最大的图片库之一。但该公司曾与其他文本到图像的人工智能生成器开发商交过手，起诉StabilityAI侵犯版权，指控其图像生成器StableDiffusion未经许可使用了Getty的照片。通过建立自己的生成式人工智能图像平台，盖蒂公司可以压制其他希望使用其图像库来训练模型的公司。使用其授权数据建立人工智能图像平台的公司远不止盖蒂一家。Adobe在其创意套件和创意云服务中发布了萤火虫（Firefly）模型，该模型是在其稳定的授权图片上训练出来的。使用受版权保护的资料来训练大型语言模型和文本到图像系统一直是许多创意界人士非常关注的问题。三位艺术家曾起诉StabilityAI、Midjourney和艺术网站DeviantArt，指控它们未经许可使用他们的艺术作品来训练模型。盖蒂表示，客户最终可以添加自己的数据来训练模型，生成具有自己品牌风格的图片。这项功能和其他服务将于今年晚些时候推出。...PC版：https://www.cnbeta.com.tw/articles/soft/1386273.htm手机版：https://m.cnbeta.com.tw/view/1386273.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人