人工智能对人工智能生成的内容进行训练将导致人工智能崩溃

人工智能对人工智能生成的内容进行训练将导致人工智能崩溃用于训练大型语言模型的数据最初来自人类来源，如书籍、文章、照片等，这些都是在没有人工智能的帮助下创建的。但随着越来越多的人使用人工智能来制作和发布内容，一个明显的问题出现了：当人工智能生成的内容在互联网上扩散时，人工智能模型开始对其进行训练。研究人员发现，“在训练中使用模型生成的内容会导致所产生的模型出现不可逆转的缺陷。”他们研究了文本到文本和图像到图像的人工智能生成模型的概率分布，得出结论：“从其他模型产生的数据中学习会导致模型崩溃这是一个退化的过程，并且随着时间的推移，模型会忘记真正的基础数据分布。”他们观察到模型崩溃发生得如此之快：模型可以迅速忘记它们最初学习的大部分原始数据。这导致它们随着时间的推移，表现越来越差，错误越来越多。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

在Telegram中查看

相关推荐

研究发现：用人工智能生成的图像训练出的人工智能产生了糟糕的结果。

研究发现：用人工智能生成的图像训练出的人工智能产生了糟糕的结果。斯坦福大学和莱斯大学的研究人员发现，生成式人工智能模型需要“新鲜的真实数据”，否则输出的质量就会下降。这对摄影师和其他创作者来说是个好消息，因为研究人员发现，训练数据集中的合成图像会放大人工痕迹，使人工智能画出的人类看起来越来越不像真人。研究小组将这种状况命名为“模型自噬障碍”。如果自噬循环的每一代都没有足够的新鲜真实数据，未来的生成模型注定会逐渐降低其质量或多样性。如果该研究论文是正确的，那么这意味着人工智能将无法开发出无穷无尽的数据源。人工智能仍然需要真实、高质量的图像来不断进步，而不是依赖自己的输出。这意味着生成式人工智能将需要摄影师。

OpenAI 签署协议以 Reddit 数据训练人工智能

OpenAI 签署协议以 Reddit 数据训练人工智能人工智能公司 OpenAI 已与 Reddit 达成协议，使用该社交新闻网站的数据来训练人工智能模型。OpenAI 表示，与 Reddit 的合作将使其能够访问 Reddit 上的“实时、结构化和独特内容” (例如帖子和回复)，从而使其工具和模型能够“更好地理解和展示”这些内容。Reddit 的内容将被整合到 OpenAI 流行的对话式人工智能 ChatGPT 中，双方将合作为 Reddit 用户和版主带来未具体说明的新“人工智能功能”。OpenAI 也将成为 Reddit 的广告合作伙伴。

TikTok将自动标记人工智能生成的内容

TikTok将自动标记人工智能生成的内容访问：Saily - 使用eSIM实现手机全球数据漫游安全可靠源自NordVPN 该社交视频平台正在通过实施内容凭证（Content Credentials）来实现这一目标，内容凭证是内容出处和真实性联盟（C2PA）的一项技术，该联盟由微软和 Adobe 共同创立。内容凭证将特定的元数据附加到内容上，TikTok 可以利用这些元数据即时识别和标记人工智能生成的内容。因此，TikTok 将开始自动标注上传到平台并附加内容证书的人工智能生成内容。这一变更将于本周四推出，并将在未来几周内适用于全球所有用户。虽然 TikTok 已经对使用 TikTok AI 特效制作的内容进行了标注，但现在它也将对在其他已实施内容证书的平台上制作的内容进行标注，如 OpenAI 的 DALL-E 3 和微软的必应图像创建器。微软、Adobe 和 OpenAI 已经开始使用内容证书，Google也承诺支持内容证书。尽管 TikTok 已经要求创作者在发布使用人工智能创建或增强的内容时进行披露，但该公司表示，新的变化是确保人工智能生成的内容被标注的另一种方式，同时也减轻了创作者的压力。在未来几个月中，TikTok 还将开始为平台上使用 TikTok 人工智能特效创建的人工智能生成内容附加内容证书。内容证书元数据将包括人工智能生成内容的制作或编辑地点和方式的详细信息，下载后仍将附加在内容上。采用内容凭证的其他平台将能自动将内容标记为人工智能生成的内容。因此，虽然 TikTok 承诺在自己的服务中标注人工智能内容，但它也在努力帮助确保在 TikTok 中制作的人工智能内容在发布到其他平台时也能准确标注。TikTok 运营及信任与安全主管 Adam Presser 在一份新闻稿中表示："人工智能生成的内容是一个令人难以置信的创意出口，但对观众而言，透明度至关重要。通过与同行合作跨平台标注内容，我们让创作者更容易负责任地探索人工智能生成的内容，同时继续阻止 TikTok 上禁止的有害或误导性 AIGC。"TikTok 宣称自己是第一个采用内容凭证技术的视频分享平台。值得一提的是，Meta早在今年二月就宣布，计划在 C2PA 的解决方案基础上为内容添加出处。作为周四公告的一部分，TikTok 表示将致力于打击在选举中使用欺骗性人工智能的行为，其政策坚决禁止人工智能生成的有害误导性内容无论是否贴有标签。 ... PC版：手机版：

美国新法案要求人工智能公司披露受版权保护的训练数据

美国新法案要求人工智能公司披露受版权保护的训练数据美国新法案将迫使科技公司披露用于训练其人工智能模型的任何受版权保护的数据。美国众议员 Adam Schiff (D-CA) 提出的生成人工智能版权披露法案将要求任何为人工智能制作训练数据集的人向版权登记处提交有关其内容的报告。报告应包含数据集中受版权保护的材料的详细摘要以及数据集的 URL (如果可公开获取)。此要求将扩展到对数据集所做的任何更改。公司必须在使用训练数据集的人工智能模型向公众发布之前“不迟于30天”提交报告。该法案不会追溯到现有的人工智能平台，除非其成为法律后对其训练数据集进行更改。

TikTok 将自动标记更多人工智能生成内容

TikTok 将自动标记更多人工智能生成内容 TikTok 正在加大力度在其应用中自动标记人工智能生成的内容，即使这些内容是使用第三方工具创建的。该公司宣布计划支持「内容凭证(content credentials)」，这是一种表明使用了生成式人工智能的数字水印。TikTok 的规则已经要求创作者披露“逼真的”人工智能生成内容。但这项政策可能很难执行，特别是当创作者使用其他公司的人工智能工具时。但由于内容凭证在整个人工智能行业中越来越多地使用，TikTok 的新自动化标签应该能够弥补其中的一些差距。TikTok 称，该公司将是第一个支持内容凭证的视频平台。谷歌、微软、OpenAI 和 Adobe 都承诺支持内容凭证。、

纽约时报禁止使用其内容来训练人工智能模型

纽约时报禁止使用其内容来训练人工智能模型《纽约时报》已采取先发制人的措施，阻止其内容被用于训练人工智能模型。据 Adweek 报道，《纽约时报》于 8 月 3 日更新了服务条款，禁止将其内容（包括文字、照片、图像、音频/视频剪辑、“外观和感觉”、元数据或汇编）用于开发“任何软件程序，包括但不限于训练机器学习或人工智能（AI）系统。” 更新后的条款还规定，未经出版物的书面许可，不得使用旨在使用、访问或收集此类内容的网站爬虫等自动化工具。《纽约时报》表示，拒绝遵守这些新限制可能会导致未具体说明的罚款或处罚。尽管在其政策中引入了新规则，但该出版物似乎并未对其 robots.txt 进行任何修改，该文件用于告知搜索引擎爬虫哪些 URL 可以访问。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人