Bark开源的文字生成音频模型。

项目Bark功能：文本音频模型

项目Bark 项目功能：文本音频模型项目简介：Bark是由Suno创建的基于transformer的文本转音频模型。Bark能够生成高度逼真的多语言语音，以及其他音频，包括音乐、背景噪音和简单的音效。该模型还可以产生笑声、叹息和哭声等非语言交流。 Bark支持各种语言，可以自动从输入文本中确定语言。当输入的文本是混合编码时，Bark会尝试使用相应语言的本地口音。目前英语的质量最好项目地址：点击直达排队申请：点击直达

Meta开源了AI 音频生成工具 AudioCraft，包含 3 个模型：

Meta开源了AI 音频生成工具 AudioCraft，包含 3 个模型： - MusicGen 文本生成音乐 - AudioGen 文本生成音频 - EnCodec 损失更少的音频压缩 || MusicGen在HuggingFace 上的

Bark，一个模拟声音的开源AI项目

Bark，一个模拟声音的开源AI项目可以生成所有类型的音频，并且基本上看不出与真实语音、音乐间的区别。这些音频包括音乐、背景噪音和一些简单的音效。是的，你没听错，你甚至可以拿它来生成音乐。该模型还可以产生非语言交流，如笑、叹息和哭泣。 Bark 支持各种语言，开箱即用，并根据输入文本自动确定语言。当提示使用代码切换文本时，Bark 将尝试使用相应语言的本地口音。英语质量目前是最好的，估计其他语言会随着扩展而进一步提高。 #AI 来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

Valle 的AI生成人声效果，已经有 @elevenlabsio 这家公司实现并且商用，支持任意5s音频作为 prompt 进

Valle 的AI生成人声效果，已经有 @elevenlabsio 这家公司实现并且商用，支持任意5s音频作为 prompt 进行合成。这是他们用了很多名人的声音所做的 demo ，自己感受下吧（目前声纹不具有版权，很容易被滥用） : 如果你想了解 AI 生成人声已经发展到什么地步了可以在这里试听最新的 Valle 的 demo 只需要3秒的人声输入作为 Prompt 就可以生成同样的人声而且不光是人声，连背景噪音都能生成

新的开源图像生成模型:Kandinsky 2.1，可以生成混搭图像，支持 txt2img 和 image mixing

新的开源图像生成模型:Kandinsky 2.1，可以生成混搭图像，支持 txt2img 和 image mixing 它不是基于Stable Diffusion开发的，是一个全新的开原模型，目前看主要优势是速度快，但还看不出来图片质量上明显的优势。 ||

Meta 开源了 AudioCraft，包含两个模型

Meta 开源了 AudioCraft，包含两个模型 MusicGen：生成音乐，音乐家可以用文本来描述一首曲子的乐器和风格，以探索最佳的表现形式 AudioGen：生成音效，独立游戏开发者可以低成本地添加音效和环境噪音