项目GPT-SoVITS-WebUI

项目GPT-SoVITS-WebUI 项目功能:语音克隆 项目简介:一个强大的音色克隆模型,可以用少量的语音数据来训练和转换不同的声音。 它支持中文、英文和日文的语音合成,可以实现零样本和少样本的文本到语音转换。 它还提供了一个WebUI工具,集成了语音伴奏分离、自动训练集分割、中文ASR和文本标注等功能,帮助用户创建训练数据集和GPT/SoVITS模型。 项目地址:点击直达 频道 群聊 投稿 商务

相关推荐

封面图片

一款适用于中文语音克隆的工具:GPT-SoVITS

一款适用于中文语音克隆的工具:GPT-SoVITS 仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆。若提供 1 分钟语音样本可以逼近真人的效果,且训练出高质量的 TTS 模型! 目前已获得 1.1k Star,看到很多人对其评价为目前最强中文语音克隆工具。值得大家一试,Windows 用户可直接开箱使用。 频道:@kejiqu 群组:@kejiquchat

封面图片

:这个项目可以从20秒的音频中快速生成克隆语音,并自动转换为英语。即便你不会说英语,也可以通过语音克隆的方式,立刻说出一口流利的

:这个项目可以从20秒的音频中快速生成克隆语音,并自动转换为英语。即便你不会说英语,也可以通过语音克隆的方式,立刻说出一口流利的英语。 这里的技术采用了一个名为 Parrot 的模型,它能从几秒的音频克隆出声音,并基于文本,重新生成一段富有情感的语音。 目前该模型只支持英语,不过技术团队已经在开始尝试支持更多语言。 克隆声音的数据样本主要分两种:高保真(20 分钟)和零样本(20 秒),给的音频样本时间越长,其精度就更佳。 未来,该工具将被应用到各类数字内容创作(如游戏、媒体、在线教育)等平台。

封面图片

#软件 #开源 #AI #TTS

#软件 #开源 #AI #TTS Pandrator - 开源高质量文本转语音工具 ▎软件功能:文本转语音 ▎软件平台:#Windows ▎软件介绍:一种工具,旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频,包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。 它利用 XTTS、Silero 和 VoiceCraft 模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高质量和更好的语音克隆结果,并通过 NISQA 进行音频质量评估。 此外,它还集成了 Text Generation Webui 的 API,用于基于本地LLM的文本预处理,从而在音频生成之前实现广泛的文本操作。 ▎软件下载:点击下载

封面图片

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS!

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS! 根据演示来看,它似乎是目前中文支持比较好的模型 试了试,只要 5 秒的数据,它就可以模仿我的声音,更牛的是,一分钟的录音就能训练出高质量的模型,完美克隆声音 YYDS! 项目地址:

封面图片

项目MockingBird

项目MockingBird 项目功能:实时语音克隆 项目语言:Python 项目简介:一款开源的语音克隆工具,支持普通话测试集中使用了多种中文数据。 支持使用数据集自己训练合成器模型,也可以使用社区预先训练好的合成器模型。 对新手不太友好,初次使用可以先看网页附带的教程。 项目地址:点击直达

封面图片

项目Auto-GPT功能:自主 GPT-4 实验

项目Auto-GPT 项目功能:自主 GPT-4 实验 项目简介:一个实验性开源应用程序,展示了 GPT-4 语言模型的功能。 具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。 用户让 AutoGPT 建立一个网站,不到 3 分钟 AutoGPT 就成功了。期间 AutoGPT 使用了 React 和 Tailwind CSS,全凭自己,人类没有插手。 项目地址:点击直达

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人