15秒语音片段就能合成某人声音，OpenAI小规模开放VoiceEngine模型-IT之家https://www.ithome.

OpenAI 发布"语音引擎"模型

OpenAI发布"语音引擎"模型VoiceEngine模型使用文本输入和单个15秒音频样本来生成与原始说话者非常相似的自然语音，小样本即可创建情感丰富且逼真的声音。该模型于2022年底首次开发，正在支持ChatGPT语音朗读和文本转语音API，已被HeyGen等企业用户采用。由于合成语音的滥用风险，VoiceEngine每段音频都有用于跟踪的隐水印，并且OpenAI暂不打算广泛部署和允许个人声音克隆，直到公众意识到深度伪造的挑战。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

安全公司警告黑客正瞄准各大AI语言模型平台用户账号，转卖API余额/获取隐私信息-IT之家https://www.ithome.

OpenAI公布其语音生成模型：Voice Engine

OpenAI公布其语音生成模型：根据文本输入和一个15秒的音频样本，就能生成接近原始说话者声音的自然听起来的语音。VoiceEngine最初于2022年底开发，并已经提供给包括Heygen在内的少数公司进行测试性使用。主要功能1、自然听起来的语音生成：利用单个15秒的音频样本，VoiceEngine能够创造出既情感丰富又真实的语音，显著提升合成语音的自然度和真实感。2、支持多种用途：从教育援助、内容翻译、提高偏远地区服务质量，到支持非语言人士和帮助患者恢复声音，VoiceEngine的应用场景广泛，跨越多个行业。3、语言和口音的保留：在内容翻译时，VoiceEngine能够保留原始发言者的本地口音，使得翻译后的语音不仅流利还能保持原声音的特色。4、多语种支持：能够生成多种语言的语音输出，适应全球化需求，特别是对于需要将内容本地化到不同语言市场的企业和内容创作者来说，这一特点尤为重要。

15秒语音片段就能合成某人声音，OpenAI小规模开放VoiceEngine模型-IT之家https://www.ithome.

相关推荐

OpenAI 发布"语音引擎"模型

安全公司警告黑客正瞄准各大AI语言模型平台用户账号，转卖API余额/获取隐私信息-IT之家https://www.ithome.

OpenAI公布其语音生成模型：Voice Engine

OpenAI竞争对手Anthropic发布其最强AI大模型Claude3.5-IT之家https://www.ithome.co

OpenAI宣布向ChatGPT付费用户开放新GPT-4Turbo模型-IT之家https://www.ithome.com/0

微软关闭B社旗下Arkane奥斯汀、TangoGameworks等多家游戏工作室-IT之家https://www.ithome.