OpenAI 发布 Voice Engine

OpenAI发布VoiceEngine，该系统可以从15秒的录音中重现人的声音。如果您上传自己的录音和一段文本，它可以使用听起来像您的合成语音来读取文本。文本不必是您的母语。例如，如果您说英语，它可以用西班牙语、法语、中文或许多其他语言重新创建您的声音。OpenAI并未更广泛地分享该技术，因为它仍在尝试了解其潜在危险。与图像和视频生成器一样，语音生成器可以帮助在社交媒体上传播虚假信息。它还可能允许犯罪分子在网上或打电话期间冒充他人。该公司表示，它特别担心这种技术可能会被用来破坏控制网上银行账户和其他个人应用程序访问的语音验证器。“这是一件敏感的事情，正确处理很重要。”OpenAI产品经理杰夫·哈里斯（JeffHarris）在接受采访时表示。该公司正在探索对合成声音加水印或添加控制措施的方法，以防止人们使用带有政治家或其他知名人物声音的技术。上个月，OpenAI推出了视频生成器Sora，采取了类似的方法。它展示了这项技术，但没有公开发布。via匿名标签:#OpenAI#VoiceEngine频道:@GodlyNews1投稿:@GodlyNewsBot

在Telegram中查看

相关推荐

OpenAI公布其语音生成模型：Voice Engine

OpenAI公布其语音生成模型：根据文本输入和一个15秒的音频样本，就能生成接近原始说话者声音的自然听起来的语音。VoiceEngine最初于2022年底开发，并已经提供给包括Heygen在内的少数公司进行测试性使用。主要功能1、自然听起来的语音生成：利用单个15秒的音频样本，VoiceEngine能够创造出既情感丰富又真实的语音，显著提升合成语音的自然度和真实感。2、支持多种用途：从教育援助、内容翻译、提高偏远地区服务质量，到支持非语言人士和帮助患者恢复声音，VoiceEngine的应用场景广泛，跨越多个行业。3、语言和口音的保留：在内容翻译时，VoiceEngine能够保留原始发言者的本地口音，使得翻译后的语音不仅流利还能保持原声音的特色。4、多语种支持：能够生成多种语言的语音输出，适应全球化需求，特别是对于需要将内容本地化到不同语言市场的企业和内容创作者来说，这一特点尤为重要。

penAI公布其语音生成模型：Voice Engine

OpenAI公布其语音生成模型：VoiceEngine根据文本输入和一个15秒的音频样本，就能生成接近原始说话者声音的自然听起来的语音。主要功能1、自然听起来的语音生成：利用单个15秒的音频样本，VoiceEngine能够创造出既情感丰富又真实的语音，显著提升合成语音的自然度和真实感。2、支持多种用途：从教育援助、内容翻译、提高偏远地区服务质量，到支持非语言人士和帮助患者恢复声音，VoiceEngine的应用场景广泛，跨越多个行业。3、语言和口音的保留：在内容翻译时，VoiceEngine能够保留原始发言者的本地口音，使得翻译后的语音不仅流利还能保持原声音的特色。4、多语种支持：能够生成多种语言的语音输出，适应全球化需求，特别是对于需要将内容本地化到不同语言市场的企业和内容创作者来说，这一特点尤为重要。

OpenAI 的 Sora 将于今年晚些时候公开发布

OpenAI的Sora将于今年晚些时候公开发布OpenAI首席技术官MiraMurati在接受采访时表示，Sora文本转视频生成器将于“今年”面向公众推出，“可能需要几个月”。OpenAI还计划“最终”整合音频，这有可能使场景更加真实。该公司还希望允许用户编辑Sora制作的视频中的内容，因为人工智能工具并不总是能创建准确的图像。Murati还提到Sora的运行成本比其他模型“昂贵得多”，OpenAI希望在最终发布时可以让成本降到DALL-E的水平。在被问到训练数据时，Murati表示，她不确定它是否使用了YouTube、Facebook和Instagram上的视频。——

OpenAI 首次展示音频模型 Voice Engine 15 秒即可复制原音

OpenAI首次展示音频模型VoiceEngine15秒即可复制原音3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型“VoiceEngine”。用户只需要提供15秒左右的参考声音，通过VoiceEngine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。除了能合成音频之外，OpenAI还展示了VoiceEngine很多其他际商业用途，例如，一位失去声音表达能力的女孩，在VoiceEngine帮助下能像以前一样正常发音说话。

OpenAI 发布"语音引擎"模型

OpenAI发布"语音引擎"模型VoiceEngine模型使用文本输入和单个15秒音频样本来生成与原始说话者非常相似的自然语音，小样本即可创建情感丰富且逼真的声音。该模型于2022年底首次开发，正在支持ChatGPT语音朗读和文本转语音API，已被HeyGen等企业用户采用。由于合成语音的滥用风险，VoiceEngine每段音频都有用于跟踪的隐水印，并且OpenAI暂不打算广泛部署和允许个人声音克隆，直到公众意识到深度伪造的挑战。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

OpenAI 拟携 Sora 进军电影市场安排下周与工作室和导演们开会

OpenAI拟携Sora进军电影市场安排下周与电影工作室和导演们开会OpenAI安排下周在美国洛杉矶与好莱坞诸多工作室、媒体高管、艺人经纪开会，以构建娱乐产业的合作伙伴关系、并鼓励众多制片公司将OpenAI的新款AI视频生成器融入它们的工作中。OpenAI向好莱坞推介其AI视频生成工具Sora，公司CEOAltman已经在奥斯卡电影节周末出席洛杉矶的多场派对。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人