RT 宝玉SoundStorm:高效并行音频生成
RT 宝玉SoundStorm:高效并行音频生成SoundStorm是Google发布的一个用于高效、非自回归音频生成的模型。看了下项目首页上的演示,我觉得生成速度还罢了,它的演示音频让我觉得厉害的地方是只要3秒的样本,就能按照原本说话的音色生成后续的音频,而且很自然。…AK: SoundStorm:EfficientParallelAudioGenerationSoundStormgenerates30secondsofaudioin0.5secondsonaTPU-v4.Demonstratetheabilityofmodeltoscaleaudiogenerationtolongersequencesbysynthesizinghigh-quality,naturaldialoguesegments,givenatranscript…
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人