#GitHub#TTSChatTTS-对话式高可控的语音合成模型▎项目功能:文本转语音模型▎项目介绍:一款专门为对话场景设计的文
#GitHub#TTSChatTTS-对话式高可控的语音合成模型▎项目功能:文本转语音模型▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本。使用需知为了限制ChatTTS的使用,我们在4w小时模型的训练过程中添加了少量额外的高频噪音,并用mp3格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。▎项目亮点:⏺对话式TTS:ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。⏺细粒度控制:该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。⏺更好的韵律:ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。▎项目地址:点击打开
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人