arler-TTS

网站名称:Parler-TTS网站功能:文本转语音网站简介:一款开源免费高质量的文本到语音(TTS)模型,能够生成高质量、听起来自然的语音,支持不同的说话者特性,如性别、音调和说话风格等。完全开源,包括数据集、预处理、训练代码和权重,允许社区在此基础上构建和开发自己的强大TTS模型。体验网站:开源地址:

相关推荐

封面图片

Seed-TTS,由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型。该模型能够生成高质量、几乎无法与人类声音区分的语音

Seed-TTS,由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型。该模型能够生成高质量、几乎无法与人类声音区分的语音。Seed-TTS在语音上下文学习方面表现出色,说话人相似性和自然度的表现都与真实人类语音相匹配目前还没有实际发布产品,只是论文和演示#TTS#AI#文本转语音链接:https://www.appmiu.com/newsflashes/23729.html

封面图片

MyShell 开源了号称目前全世界效果最好的 TTS 库 MeloTTS

MyShell开源了号称目前全世界效果最好的TTS库MeloTTS代码:https://github.com/myshell-ai/MeloTTS体验:https://huggingface.co/spaces/mrfakename/MeloTTS哥飞给大家介绍下,目前MeloTTS支持英语、西班牙语、法语、中文、日语和韩语,号称是目前最好的高质量多语言文本转语音库。还支持中英混杂,有点优秀哦。

封面图片

ChatTTS是最近很火的超逼真TTS(文本转语音)模型,重点是开源了O!

ChatTTS是最近很火的超逼真TTS(文本转语音)模型,重点是开源了O!试了下,是真的没有机器味儿啊...太强了现在HuggingFaceSpace上有不少的demo可以体验效果,大家也可以试试:https://huggingface.co/spaces/Dzkaka/ChatTTS•模型下载:https://huggingface.co/2Noise/ChatTTS•GitHub:https://github.com/2noise/ChatTTS

封面图片

网站名称:StableCascade网站功能:AI绘图网站简介:StabilityAI开发的基于Würstchen架构的新一代文

网站名称:StableCascade网站功能:AI绘图网站简介:StabilityAI开发的基于Würstchen架构的新一代文生图模型,StableCascade采用三阶段方法,非常容易在消费类硬件上进行训练和微调。能够根据输入的文本提示生成高质量的图像。除了文本到图像生成外,StableCascade还可用于图像修复、面部识别、边缘检测、超分辨率等多种应用领域。体验地址:点击打开开源地址:点击访问详细介绍:点击查看频道群聊投稿

封面图片

ILibHub

网站名称:UILibHub网站功能:组件库资源网站简介:一款专注于收集和分享高质量的React、Vue和小程序组件库资源的网站。增加了React、移动端和小程序的UI库,目前收录了超过30个高质量的UI库。适合构建各种资源导航网站,例如AI工具目录、前端工具目录、学习资源目录、设计资源库和开源项目展示。网站链接:开源地址:

封面图片

#GitHub#TTSChatTTS-对话式高可控的语音合成模型▎项目功能:文本转语音模型▎项目介绍:一款专门为对话场景设计的文

#GitHub#TTSChatTTS-对话式高可控的语音合成模型▎项目功能:文本转语音模型▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本。使用需知为了限制ChatTTS的使用,我们在4w小时模型的训练过程中添加了少量额外的高频噪音,并用mp3格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。▎项目亮点:⏺对话式TTS:ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。⏺细粒度控制:该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。⏺更好的韵律:ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。▎项目地址:点击打开

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人