ChatTTS是最近很火的超逼真TTS(文本转语音)模型,重点是开源了O!

ChatTTS是最近很火的超逼真TTS(文本转语音)模型,重点是开源了O! 试了下,是真的没有机器味儿啊...太强了 现在HuggingFace Space上有不少的demo可以体验效果,大家也可以试试: •模型下载: •GitHub:

相关推荐

封面图片

Seed-TTS,由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型。该模型能够生成高质量、几乎无法与人类声音区分的语音

Seed-TTS,由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型。该模型能够生成高质量、几乎无法与人类声音区分的语音。 Seed-TTS 在语音上下文学习方面表现出色,说话人相似性和自然度的表现都与真实人类语音相匹配 目前还没有实际发布产品,只是论文和演示 #TTS #AI #文本转语音 链接:

封面图片

YouTube同声传译:字幕文本转语音TTS(适用于沉浸式翻译)

YouTube同声传译:字幕文本转语音TTS(适用于沉浸式翻译) 这是一个专为YouTube设计的油猴脚本,可以将沉浸式翻译生成的双语字幕自动转换为语音播放。将YouTube上的沉浸式翻译双语字幕转换为语音播放,支持更改音色和调整语音速度,支持多语言,自动检测并朗读沉浸式翻译生成的双语字幕,支持多种语言和音色。 智能语音队列管理,确保字幕朗读不重叠,新字幕出现时会等待当前语音播放完成 脚本地址:

封面图片

:全新的文本转语音(TTS)解决方案,具有高度自定义和灵活性,支持Linux和Windows系统,需要2GB的GPU内存进行推理

:全新的文本转语音(TTS)解决方案,具有高度自定义和灵活性,支持Linux和Windows系统,需要2GB的GPU内存进行推理,使用Flash-Attn进行推理和训练,支持VQGAN和Text2Semantic模型

封面图片

再分享一个神器,微软出品的视频剪辑工具climpchamp,网址是clipchamp.com,居然可以白嫖微软的文字转语音TTS

再分享一个神器,微软出品的视频剪辑工具climpchamp,网址是clipchamp.com,居然可以白嫖微软的文字转语音TTS,而且音色比微软自家Azure AI里面的TTS音色还多,其中一个是进化了的V2版女声,更加接近真人音色,真香。这个工具有Windows软件版,也有网页版,Mac电脑可以用网页版,网页版不能分离音频,但是可以导出空白的mp4,通过其他软件分离音频。

封面图片

OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型

OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型 OpenAI最近发布了名为Shap・E的模型,可以通过输入文本创建逼真且多样化的3D模型。这种模型与现有的只能输出点云或体素的模型不同,可以生成高质量的3D资产,具有细粒度纹理和复杂形状。 Shap・E不仅仅是一个3D模型生成器,而且可以直接生成隐式函数的参数,这些参数可以用于渲染纹理网格和神经辐射场(NeRF)。NeRF是一种具有隐式场景表示的新型视场合成技术,在计算机视觉领域引起了广泛的关注。它可以用于视图合成和三维重建,广泛应用于机器人、城市地图、自主导航、虚拟现实/增强现实等领域。 值得注意的是,Shap・E模型还可以生成神经辐射场,这是一种新型的三维场景表示方法。通过这种方法,Shap・E可以呈现更加真实的光照效果和材质感,让3D图像更加生动、逼真。未来,这种模型可能会被广泛应用于游戏、电影、建筑等领域,为人们带来更加精彩、逼真的视觉体验。#AI 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS!

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS! 根据演示来看,它似乎是目前中文支持比较好的模型 试了试,只要 5 秒的数据,它就可以模仿我的声音,更牛的是,一分钟的录音就能训练出高质量的模型,完美克隆声音 YYDS! 项目地址:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人