OpenAI展示语音克隆人工智能模型只需15秒样本即可工作

OpenAI展示语音克隆人工智能模型只需15秒样本即可工作可以访问的公司包括教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan。在 OpenAI 发布的这些样本中，你可以听到Age of Learning利用该技术生成预制画外音内容，以及向学生朗读由 GPT-4 撰写的 "实时、个性化回复"。首先是英文参考音频：下面是人工智能根据该样本生成的三个音频片段：OpenAI 表示，它于 2022 年底开始开发语音引擎，该技术已经为文本到语音 API 和ChatGPT 的朗读功能提供了预设语音。OpenAI 语音引擎产品团队成员杰夫-哈里斯（Jeff Harris）在接受TechCrunch 采访时表示，该模型是在 "授权数据和公开数据的混合 "基础上训练出来的。OpenAI 告诉该刊物，该模型将只向大约 10 名开发者开放。人工智能文本到音频生成是生成式人工智能的一个不断发展的领域。虽然大多数人都专注于乐器或自然声音，但专注于语音生成的人较少，部分原因是 OpenAI 提出的问题。该领域的一些知名公司包括 Podcastle 和 ElevenLabs，它们提供人工智能语音克隆技术和工具。与此同时，美国政府也在努力遏制不道德地使用人工智能语音技术。上个月，美国联邦通信委员会禁止了使用人工智能语音的自动拨叫电话，因为人们收到了由人工智能克隆的乔-拜登总统的声音打来的垃圾电话。据 OpenAI 称，其合作伙伴同意遵守其使用政策，即未经同意不得使用语音生成技术冒充他人或组织。该政策还要求合作伙伴获得原始发言人的 "明确和知情同意"，不建立个人用户创建自己声音的方法，并向听众披露声音是人工智能生成的。OpenAI 还为音频片段添加了水印，以追踪其来源，并积极监控音频的使用情况。OpenAI 提出了几项措施，认为这些措施可以限制类似工具的风险，包括逐步淘汰访问银行账户的语音认证，制定政策保护人工智能中对人声的使用，加强人工智能深度伪造方面的教育，以及开发人工智能内容跟踪系统。了解更多： ... PC版：手机版：

在Telegram中查看

相关推荐

OpenAI 的语音克隆人工智能模型只需要15秒的样本即可工作

OpenAI 的语音克隆人工智能模型只需要15秒的样本即可工作人工智能公司 OpenAI 正在提供对其开发的文本转语音生成平台 Voice Engine 的有限访问权限，该平台可以根据某人15秒的声音片段创建合成声音。人工智能生成的语音可以根据命令以与说话者相同的语言或其他多种语言读出文本提示。OpenAI 在其博客文章中表示：“这些小规模部署有助于我们了解方法、保障措施，并思考如何在各个行业中很好地利用 Voice Engine。”拥有访问权限的公司包括教育科技公司 Age of Learning、视觉叙事平台 HeyGen、一线健康软件制造商 Dimagi、人工智能通信应用创建者 Livox 和健康系统 Lifespan。、

OpenAI 悄然关闭其人工智能检测工具

OpenAI 悄然关闭其人工智能检测工具一月份，人工智能巨头 OpenAI 宣布推出一款工具，AI生成文本分类器，该工具能够用于区分由人类编写或是人工智能生成的文本，用于辅助解决自动化误导性活动和学术欺骗等问题。半年后，这个工具就死了，因为它无法完成其设计目的。这就上周， OpenAI 悄悄地断开了其 AI 检测工具 AI Classifier，因为该公司表示该工具的准确率较低。 OpenAI写道：“我们正在努力整合反馈，目前正在研究更有效的文本来源技术，并承诺开发和部署机制，使用户能够了解音频或视觉内容是否是人工智能生成的。”

OpenAI 表示已开始训练新的旗舰人工智能模型

OpenAI 表示已开始训练新的旗舰人工智能模型 OpenAI 周二表示，它已开始训练一种新的旗舰人工智能模型，该模型将取代驱动其流行在线聊天机器人 ChatGPT 的 GPT-4 技术。 OpenAI 在一篇博客文章中表示，希望新模型能够带来“更高水平的能力”，因为该公司致力于打造“通用人工智能”，即能够做任何人类大脑能做的事情的机器。新模型将成为人工智能产品的引擎，包括聊天机器人、类似于苹果 Siri 的数字助理、搜索引擎和图像生成器。，

唱片协会(RIAA)建议美国政府将人工智能语音克隆网站列入政府盗版监视名单

唱片协会(RIAA)建议美国政府将人工智能语音克隆网站列入政府盗版监视名单美国唱片工业协会 (RIAA) 现在认为人工智能语音克隆是一种潜在的版权侵权威胁，并希望美国政府将其纳入盗版监管名单。在提交给美国贸易代表 (USTR) 的一份文件中，RIAA 要求美国政府将人工智能语音克隆类别纳入其据称宣扬盗版或假冒行为的年度实体名单中。美国唱片工业协会(RIAA)只点名了该领域的一家公司：。该公司提供例如 Ariana Grande、Taylor Swift 和 Kanye West 等著名音乐艺术家的语音模型。该组织认为，该网站允许用户翻录 YouTube 视频并复制无伴奏合唱曲目，然后使用人工智能语音模型对其进行修改，侵犯了版权，也侵犯了录音艺术家的公开权。

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型

报道微软正在自行开发比OpenAI更小更便宜的人工智能模型这些 SLM 旨在提供与 OpenAI 的 GPT 等大型语言模型（LLM）类似的对话和生成能力，但对硬件的需求大大降低。与外部开发的替代产品相比，这将使微软的人工智能产品和服务具有更低的相关成本和碳足迹。GenAI 团队预计将并入微软的 Azure 云计算部门，将专注于创建更小的语言模型。为了支持 GenAI 团队，微软还从其研究小组调来了几位顶尖开发人员。微软公司副总裁米沙-比连科（Misha Bilenko）将领导该团队的工作。GenAI 团队的目标是创造出与 OpenAI 等公司提供的模型功能相匹配甚至更强的人工智能，同时针对较小的规模进行优化。迄今为止，微软已将 OpenAI 的多项人工智能功能纳入其产品中。例如，必应在Copilot中使用了GPT-4，必应图像创建器在图像生成中使用了Dall-E。最近几周，该公司还推出了Copilot Pro一项针对个人消费者的订阅服务，为他们提供更先进的人工智能功能。该报告是在 OpenAI 最近推出 GPT 商店之后发布的，用户可以在该商店创建、分享和销售基于 OpenAI 语言模型的定制人工智能模型。同样，微软也宣布了自己的计划，即为Copilot提供针对特定需求和主题定制的人工智能聊天机器人。然而，依赖外部开发的人工智能会产生一些费用，而且缺乏对技术本身的控制。微软致力于开发更小巧、更经济实惠的人工智能技术，这有可能为公司提供自己的解决方案开辟新的途径，减少对第三方供应商的依赖。据说美国司法部（DOJ）和联邦贸易委员会（FTC）希望调查 OpenAI 与微软的关系，以防您错过。上周，我们曾报道，这两个机构都急于调查这笔交易，特别是微软的参与及其对人工智能行业竞争的影响。 ... PC版：手机版：

Meta 开源多感官人工智能模型

Meta 开源多感官人工智能模型宣布了一个新的开源人工智能模型，该模型将多个数据流链接在一起，包括文本、音频、视觉数据、温度和运动读数。该模型目前还只是一个研究项目，没有直接的消费者或实际应用，但它指向了生成式人工智能系统的未来，可以创造身临其境的多感官体验，并表明Meta在OpenAI和谷歌等竞争对手变得越来越隐秘的时候，仍在继续分享人工智能研究。标签: #Meta #AI 频道: @GodlyNews1 投稿: @Godlynewsbot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人