英伟达否认作者在“人工智能”诉讼中提出的版权侵权指控

英伟达否认作者在“人工智能”诉讼中提出的版权侵权指控 英伟达回应了数名美国作者提起的版权侵权诉讼。这家芯片制造商承认使用了“The Pile”数据集,其中包括有争议的 Books3 数据库。但是,英伟达否认了所有侵犯版权的指控,也拒绝使用“影子图书馆”一词。上周五,英伟达提交了起诉答辩状,对版权侵权指控做出了回应。英伟达承认使用了“The Pile”数据集进行训练。但明确否认多次复制 Books3 数据集。该公司写道:“英伟达否认将列出的数据存储库定性为‘影子库’,并否认在数据存储库中托管数据或分发数据必然违反美国版权法。” (摘抄部分)

相关推荐

封面图片

OpenAI版权诉讼越来越多 寻求更多数据来训练人工智能

OpenAI版权诉讼越来越多 寻求更多数据来训练人工智能 问题的一部分在于,出版商越来越多地指责这些公司窃取受版权保护的数据。他们希望为自己的工作获得报酬。Meta 和 OpenAI在向美国版权局提交的评论中辩称,将受版权保护的材料放在互联网上使其公开可用,因此属于合理使用。但他们仍必须在法庭上提出这一论点,因为该公司面临来自多个团体的有关版权材料的诉讼。调查报道中心是一家非营利性新闻机构,有时简称为 CIR,今年早些时候与 Mother Jones 和 Reveal 合并,上周在联邦法院起诉了 OpenAI 和微软。诉讼指控OpenAI建立在对包括 CIR 在内的全球创作者的版权作品的剥削之上。CIR 的律师指控 OpenAI 和微软使用 Mother Jones 的版权材料来训练他们的 GPT 和 Copilot AI 模型。“OpenAI 和微软开始窃取我们的新闻,以使他们的产品更加强大,但他们从未征求我们的许可或提供补偿,这与其他获得我们材料许可的组织不同。”调查报道中心首席执行官莫妮卡·鲍尔莱因 (Monika Bauerlein)在一份关于诉讼的声明中表示。“这种搭便车行为不仅不公平,而且侵犯了版权。”诉讼称,该公司 WebText 训练集中存在的顶级网络域名发布的列表中出现了来自 Mother Jones 网络域名的 16,793 个不同的 URL。在作家协会的另一起集体诉讼中,两位作家声称该公司利用他们书中的信息来训练 ChatGPT。《纽约时报》也在 2023 年 12 月对该公司提起了类似的诉讼。今年 5 月,作家协会诉讼案的法庭文件显示,OpenAI 删除了用于训练 GPT-3 的两个庞大数据集。该协会的律师表示,这两组数据可能包含超过 10 万本已出版的书籍。法庭文件称,负责整理数据的两名员工不再为 OpenAI 工作。OpenAI 已开始与新闻机构签署许可协议,以公平使用其作品。该公司已与美联社、《华尔街日报》和《纽约邮报》的出版商、《大西洋月刊》、Prisa Media、《世界报》、《金融时报》和 Business Insider 母公司 Axel Springer 签署了此类协议。但这些机器人持续学习所需的内容规模将远远超过少数几份许可协议。一种解决方案是合成数据,它是人工生成的而不是从现实世界收集的,并且可以通过机器学习算法轻松生成。OpenAI 已将合成数据视为训练其模型的一种选择,但首席执行官 Sam Altman 对生成高质量数据表示担忧。奥尔特曼在 2023 年 5 月的一次技术会议上表示: 只要你能跨越合成数据事件视界,让模型足够智能,能够生成良好的合成数据,那么一切都会好起来。该公司还探索了人工智能模型协同工作的过程一个人工智能系统生成数据,另一个人工智能系统对其进行判断。OpenAI 尚未立即回复评论请求。 ... PC版: 手机版:

封面图片

美国法院驳回针对OpenAI部分版权侵权索赔诉讼

美国法院驳回针对OpenAI部分版权侵权索赔诉讼 大多数被拒绝的索赔都集中在 ChatGPT 输出涉嫌侵犯受保护作品的版权上。法院驳回了这些指控,并裁定包括 Sarah Silverman 在内的原告无法证明 ChatGPT 的输出与受保护作品之间存在实质性相似性。因此,法院不能认定其构成侵权。法院随后驳回了原告的主张,即如果司法系统不追究 OpenAI 的法律责任,就会压制艺术家并破坏版权法本质上鼓励创造力的机制。同时,法院驳回了OpenAI以损害原告利益为代价谋取不正当利益的主张。需要强调的是,法院的裁决远非争议的最终定论。达摩克利斯之剑仍然悬在 OpenAI 以及其他人工智能 (AI) 运营商的头上。例如,原告指控该系统为了训练其使用的模型而犯下大规模版权侵权行为的指控仍然成立。法院尚未就 OpenAI 的主要辩护主张做出裁决,该主张的重点是合理使用。此外,法院尚未回应 OpenAI 的主张,即让人工智能运营商承担责任将阻碍技术进步。法院在裁决中没有驳回侵权主张这一事实至少可以说明其实力。因此,OpenAI面临的法律威胁仍然非常现实。版权主体及其保护是使用人工智能技术的企业的核心问题。因此,重要的是要确保经济中不同参与者与人工智能技术提供商之间达成的协议包括保护这些参与者免受与版权相关的法律索赔的条款,无论是在人工智能系统训练阶段还是在人工智能系统训练阶段。它的输出。2022年底,以色列司法部发表立场称,使用受版权保护的内容来训练人工智能系统通常属于合法使用安排,包括合理使用,因此不构成版权侵权。需要澄清的是,以色列法院尚未审查这一立场,也不清楚他们是否以及如何接受这一立场。我们预计这方面也会有有趣的发展。 ... PC版: 手机版:

封面图片

Meta将率先使用英伟达最新人工智能芯片

Meta将率先使用英伟达最新人工智能芯片 英伟达首席财务官科莱特·克雷斯(Colette Kress)周二告诉金融分析师,“我们将在今年晚些时候上市”,但也表示,新GPU的出货量要到2025年才会增加。而社交媒体巨头 Meta 是英伟达最大的客户之一,此前该公司购买了英伟达公司数十万上一代芯片。Meta 首席执行官马克·扎克伯格 在 1 月份就曾透露,该公司计划会在今年年底前将大约 350,000 个早期芯片(称为 H100)储存在库存中。本次Meta社交平台的发言人向外媒公布的最新消息显示,在今年晚些时候,会收到英伟达推出的全新的人工智能芯片,而且还透露,收到的将是英伟达的首批出货。此前,扎克伯格在周一的一份声明中表示,Meta 计划使用 Blackwell 来训练该公司的骆驼模型。该公司目前正在上周宣布的两个GPU集群上训练第三代模型,每个集群包含约24,000个H100 GPU。Meta 发言人表示,Meta 计划继续使用这些集群来训练 Llama 3,并将 Blackwell 用于该模型的未来几代。 ... PC版: 手机版:

封面图片

出版商诉讼指控 Libgen 侵犯版权,要求赔偿 3000 万美元

出版商诉讼指控 Libgen 侵犯版权,要求赔偿 3000 万美元 圣智出版集团、麦克米伦出版社、麦格劳希尔、培生教育对(一个盗版图书馆,简称 Libgen)提起版权侵权诉讼。正在寻求损害赔偿,并要求下令扣押该网站的域名或使其无法运行。 Library Genesis 于 2008 年左右在俄罗斯成立,主要提供当地语言的科学教科书。据报道,在提供的约 50 万册以英语为主的图书添加之后,“Libgen”又因 Sci-Hub 提供的内容而获得了巨大的增长。 根据周四晚间向美国纽约南区地方法院提起的版权诉讼,Libgen 的侵权作品超过 600 万个文件。其中至少 2万个文件由原告出版。原告称该网站以“免费接受教育”提供这些书籍只是借口,有违版权法的规定。 虽然 Libgen 运营人员身份目前未知,地点不明,但原告声称法院拥有属人管辖权,因为 Libgen 网站可以在美国访问,每月平均有来自美国的 900 万访问者。原告指出,未经授权复制和分发他们的作品违反了美国版权法。原告要求对故意侵犯版权的行为进行赔偿,理论上,这个数额可以高达 3000 万美元。原告进一步请求颁发禁令,直到 Libgen 停止侵权,并要求接管 Libgen 域名或使其无法访问。

封面图片

英伟达被诉滥用版权作品训练NeMo

英伟达被诉滥用版权作品训练NeMo Brian Keene、Abdi Nazemian和Stewart O‘Nan这三位作者表示,他们的作品是大约196,640本书组成的数据集的一部分,这些书帮助训练NeMo模拟普通的书面语言,但在10月份“他们由于被报道侵犯版权”而被撤下。在向旧金山联邦法院提起的集体诉讼中,作者们表示,下架反映出英伟达已经“承认”它在该数据集上训练了NeMo,从而侵犯了他们的版权。因此,他们要求进行赔偿,但具体数额不详。据悉,诉讼涉及的作品包括Keene于2008年所著的小说《Ghost Walk》,Nazemian于2019年所著的小说《Like a Love Story》,以及O‘Nan于2007年所著的中篇小说《Last Night at the Lobster》。这起诉讼将英伟达拖入了之前由作家和《纽约时报》围绕生成式人工智能发起的越来越多的诉讼中。生成式人工智能是一种基于文本、图像和声音等输入创造新内容的技术。此前,英伟达自称NeMo是采用生成式人工智能的一种快速且经济实惠的新选择。人工智能的崛起使英伟达成为投资者的最爱。该公司股价自2022年底以来上涨了近600%,使其市值接近2.2万亿美元。此外,其他因该技术被起诉的公司还包括创建了人工智能平台ChatGPT的OpenAI,以及它的合作伙伴微软(Microsoft)。 ... PC版: 手机版:

封面图片

人工智能公司MosaicML称不要迷信英伟达芯片 AMD芯片提供类似性能

人工智能公司MosaicML称不要迷信英伟达芯片 AMD芯片提供类似性能 目前在人工智能热潮下英伟达股价水涨船高,之前业内基本都认同英伟达的 A100/H100 加速卡提供最佳的性能,所以英伟达的这些专用加速卡被各大公司哄抢。 人工智能初创公司MosaicML在后称大家不应该迷信英伟达芯片 , 因为AMD米兰芯片的性能并不差。该公司使用多种工具对英伟达A100加速卡和AMD MI250加速卡进行测试,测试显示MI250加速卡也足够用。 MosaicML称在基于实际工作负载测试中,AMD MI250加速卡的每GPU数据吞吐量相当于英伟达A100 40GB版的 80%,是A100 80GB版的73%。因此确实有差距但差距并不算大,对人工智能公司来说并不是非得高价抢购英伟达显卡,其他加速卡也能用。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人