#音频 #AI #开源

#音频 #AI #开源 MockingBird 演示视频 丨 开源地址 实时语音克隆,5 秒内克隆你的声音并生成任意语音内容。 功能特性 • 支持普通话并使用多种中文数据集进行测试 • 适用于 pytorch,已在 1.9.0 版本中测试,GPU Tesla T4 和 GTX 2060 • 可在 Win 和 Linux 操作系统中运行 • 仅需下载或新训练合成器(synthesizer)就有良好效果 • 可伺服你的训练结果,供远程调用 频道 @WidgetChannel 投稿 @WidgetPlusBot

相关推荐

封面图片

MockingBird 实时语音克隆 - 中文/普通话

MockingBird 实时语音克隆 - 中文/普通话 AI拟声: 5秒内克隆您的声音并生成任意语音内容 特性 中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等 PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例) Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder Webserver Ready 可伺服你的训练结果,供远程调用

封面图片

项目MockingBird

项目MockingBird 项目功能:实时语音克隆 项目语言:Python 项目简介:一款开源的语音克隆工具,支持普通话测试集中使用了多种中文数据。 支持使用数据集自己训练合成器模型,也可以使用社区预先训练好的合成器模型。 对新手不太友好,初次使用可以先看网页附带的教程。 项目地址:点击直达

封面图片

#AI #声音克隆 #开源

#AI #声音克隆 #开源 CosyVoice 一个基于 AI 的声音克隆工具,只需 3 秒参考音频,即可进行超拟人真实声音复刻,无需任何训练,支持中日英韩粤语,并可跨语言复刻,生成的语音非常自然,情感也很丰富,免费使用。 体验地址 丨 项目地址 频道 @WidgetChannel

封面图片

#照片修复 #AI #开源

#照片修复 #AI #开源 GFPGAN 演示地址 丨 开源地址 一个老照片恢复到高清的项目,旨在开发用于真实世界的人脸恢复的实用算法,可以用来恢复老照片或改善人工智能生成的人脸,效果还可以,主要是修复人脸,对于其它地方的修复不太理想。 频道 @WidgetChannel 投稿 @WidgetPlusBot

封面图片

#图像处理 #AI #开源

#图像处理 #AI #开源 DragGAN 项目地址 丨 开源地址 一个交互式图像 AI 模型,可以对照片进行任意拖拽,它会根据对象的物理结构,生成精细尺度上符合现实逻辑的新图,效果非常强悍。 Midjourney 等 AIGC 工具生成的图像,也可以用它来精细微调。 注,项目源码将于 6 月发布。 频道 @WidgetChannel 投稿 @WidgetPlusBot

封面图片

#AI #翻译 #配音 #开源

#AI #翻译 #配音 #开源 视频 AI 配音和翻译工具,具有语音识别、翻译、声音克隆、数字人对口型技术等特点,支持多种语言,适用于视频搬运、全球业务等场景,免费开源,需自行部署。 频道 @WidgetChannel

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人