普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
普通人也能成为音频剪辑师,Meta推出AI模型VoiceboxMeta继推出ImageBind之后,于今天再次推出了全新的生成式AI模型。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务,即便是普通用户也能轻松上手。Meta在介绍Voicebox模型时表示,视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。AI模型本身可以生成高质量的音频剪辑,消除汽车喇叭等不必要的背景噪音,同时保留音频的内容和风格,同时使用多种语言,以六种语言生成语音。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。Meta还比较了Voicebox和Vall-E、YourTTS等其它音频AI模型,表明Voicebox更先进,在比较单词错误率和样式相似性时优于两种模型。Voicebox仍在进行中,尚未向公众开放。Meta表示,它认识到这种AI可能会造成的潜在危害,并且正在研究一种有效的方法来区分Voicebox生成的真实语音和音频。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot