#音频 #AI #开源

#音频 #AI #开源 MockingBird 演示视频 丨 开源地址 实时语音克隆,5 秒内克隆你的声音并生成任意语音内容。 功能特性 • 支持普通话并使用多种中文数据集进行测试 • 适用于 pytorch,已在 1.9.0 版本中测试,GPU Tesla T4 和 GTX 2060 • 可在 Win 和 Linux 操作系统中运行 • 仅需下载或新训练合成器(synthesizer)就有良好效果 • 可伺服你的训练结果,供远程调用 频道 @WidgetChannel 投稿 @WidgetPlusBot

相关推荐

封面图片

MockingBird 实时语音克隆 - 中文/普通话

MockingBird 实时语音克隆 - 中文/普通话 AI拟声: 5秒内克隆您的声音并生成任意语音内容 特性 中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等 PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例) Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder Webserver Ready 可伺服你的训练结果,供远程调用

封面图片

#AI #声音克隆 #开源

#AI #声音克隆 #开源 CosyVoice 一个基于 AI 的声音克隆工具,只需 3 秒参考音频,即可进行超拟人真实声音复刻,无需任何训练,支持中日英韩粤语,并可跨语言复刻,生成的语音非常自然,情感也很丰富,免费使用。 体验地址 丨 项目地址 频道 @WidgetChannel

封面图片

#照片修复 #AI #开源

#照片修复 #AI #开源 GFPGAN 演示地址 丨 开源地址 一个老照片恢复到高清的项目,旨在开发用于真实世界的人脸恢复的实用算法,可以用来恢复老照片或改善人工智能生成的人脸,效果还可以,主要是修复人脸,对于其它地方的修复不太理想。 频道 @WidgetChannel 投稿 @WidgetPlusBot

封面图片

#图像处理 #AI #开源

#图像处理 #AI #开源 DragGAN 项目地址 丨 开源地址 一个交互式图像 AI 模型,可以对照片进行任意拖拽,它会根据对象的物理结构,生成精细尺度上符合现实逻辑的新图,效果非常强悍。 Midjourney 等 AIGC 工具生成的图像,也可以用它来精细微调。 注,项目源码将于 6 月发布。 频道 @WidgetChannel 投稿 @WidgetPlusBot

封面图片

#软件 #开源 #AI #TTS

#软件 #开源 #AI #TTS Pandrator - 开源高质量文本转语音工具 ▎软件功能:文本转语音 ▎软件平台:#Windows ▎软件介绍:一种工具,旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频,包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。 它利用 XTTS、Silero 和 VoiceCraft 模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高质量和更好的语音克隆结果,并通过 NISQA 进行音频质量评估。 此外,它还集成了 Text Generation Webui 的 API,用于基于本地LLM的文本预处理,从而在音频生成之前实现广泛的文本操作。 ▎软件下载:点击下载

封面图片

#markdown #Win #开源

#markdown #Win #开源 MDvideo 项目主页 丨 开源地址 一个桌面软件,自动将 Markdown 文档转成一段视频,文档里面的视频、音频、图片网址,都会抓取后插入视频,还可以根据文字生成人工语音的旁白朗读。 功能特性 • 开箱即用,将注意力集中在文档编写和配置上 • 视频、音频和图片等文件远程抓取并剪辑 • 方便快捷的添加字幕 • 支持自定义文字样式位置 • 支持语音合成的旁白 频道 @WidgetChannel 投稿 @WidgetPlusBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人