Amphion 是一个开源的音频、音乐和语音生成工具包。

音频、音乐和语音生成的工具包，旨在支持可复现的研究，帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发，提供经典模

音频、音乐和语音生成的工具包，旨在支持可复现的研究，帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发，提供经典模型或架构的可视化特性，有助于初级研究人员和工程师更好地理解模型。 | #工具

Meta发布开源AI工具AudioCraft，可帮助用户创作音乐和音频

Meta发布开源AI工具AudioCraft，可帮助用户创作音乐和音频美东时间周三，Meta发布了一款开源人工智能（AI）工具，该工具可以帮助用户根据文本提示创作音乐和音频。Meta表示，这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉，可用文本内容生成高质量、逼真的音频和音乐。来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

Pandrator - 开源高质量文本转语音工具

Pandrator - 开源高质量文本转语音工具 ▎软件功能：文本转语音 ▎软件平台：#Windows ▎软件介绍：一种工具，旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频，包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。它利用 XTTS、Silero 和 VoiceCraft 模型进行文本到语音转换和语音克隆，并通过 RVC_CLI 进行增强，以提高质量和更好的语音克隆结果，并通过 NISQA 进行音频质量评估。此外，它还集成了 Text Generation Webui 的 API，用于基于本地LLM的文本预处理，从而在音频生成之前实现广泛的文本操作。 ▎软件下载：点击下载 #软件 #开源 #AI #TTS

Meta 发布开源 AI 工具 AudioCraft，用户可通过文本提示创作音乐、音频

Meta 发布开源 AI 工具 AudioCraft，用户可通过文本提示创作音乐、音频 Meta 开源了一款生成式 AI 工具 AudioCraft，可帮助用户通过文本提示创作音乐和音频。根据 Meta 官方介绍，AudioCraft 包含了三个核心组件： 1、MusicGen：使用 Meta 拥有 / 特别授权的音乐进行训练，根据文本提示生成音乐。 2、AudioGen：使用公共音效进行训练生成音频或扩展现有音频，后续还可生成环境音效（如狗叫、汽车鸣笛、木地板上的脚步声）。 3、EnCodec（改进版）：基于神经网络的音频压缩解码器，可生成更高质量的音乐并减少人工痕迹，或对音频文件进行无损压缩。该工具经过开源之后，相关研究人员和从业人员可以使用自己的数据集训练模型。官方宣称 AudioCraft 系列模型能够长期稳定地生成高质量音频，而且易于使用，能够为音乐家和声音设计师“提供灵感”，帮助他们快速集思广益，并“以新的方式迭代他们的作品”。 AudioCraft 项目地址：、

百度技术团队在开源了一个 #NLP 工具包：

百度技术团队在开源了一个 #NLP 工具包：具备易用的文本领域 API，多场景的应用示例、和高性能分布式训练三大特点，旨在提升开发者在文本领域的开发效率，并提供丰富的 NLP 应用示例。对该开源项目有兴趣的同学，可参加他们在本周的几场公开课，主要讲解多场景 NLP 任务流设计、快速提升模型效果、机器翻译项目实践等内容。

- 文本到语音的转换工具