ElevenLabs 支持通过提示词创建音效，例如爆炸或其他音效

ElevenLabs已经提供了由AI生成的人声和音乐。现在，它还允许人们为播客、电影或游戏创建音效。新的音效工具可以根据用户提示生成最长22秒的声音，这些声音可以与公司的语音和音乐平台结合使用，并为用户提供至少四种可下载的音频剪辑选项。该公司表示，他们与股票媒体平台Shutterstock合作，建立了一个音频库，并用这些音频片段来训练他们的模型。Shutterstock已经将其内容库授权给许多AI公司，包括OpenAI、Meta和Google。这些音效是免费使用的，但付费用户可以用生成的音频片段进行商业用途，而免费用户“必须在标题中注明‘elevenlabs.io’”。ElevenLabs用户在编写提示时有字符数限制，免费用户每月有10,000字符的额度。对于音效，ElevenLabs在其常见问题页面上表示，如果用户自己设置音频片段的时长，将从配额中每秒扣除40个字符。如果使用默认的音频时长，每次提示请求将扣除200个字符。标签:#ElevenLabs#AI频道:@GodlyNews1投稿:@GodlyNewsBot

在Telegram中查看

相关推荐

Meta 发布开源 AI 工具 AudioCraft，用户可通过文本提示创作音乐、音频

Meta发布开源AI工具AudioCraft，用户可通过文本提示创作音乐、音频Meta开源了一款生成式AI工具AudioCraft，可帮助用户通过文本提示创作音乐和音频。根据Meta官方介绍，AudioCraft包含了三个核心组件：1、MusicGen：使用Meta拥有/特别授权的音乐进行训练，根据文本提示生成音乐。2、AudioGen：使用公共音效进行训练生成音频或扩展现有音频，后续还可生成环境音效（如狗叫、汽车鸣笛、木地板上的脚步声）。3、EnCodec（改进版）：基于神经网络的音频压缩解码器，可生成更高质量的音乐并减少人工痕迹，或对音频文件进行无损压缩。该工具经过开源之后，相关研究人员和从业人员可以使用自己的数据集训练模型。官方宣称AudioCraft系列模型能够长期稳定地生成高质量音频，而且易于使用，能够为音乐家和声音设计师“提供灵感”，帮助他们快速集思广益，并“以新的方式迭代他们的作品”。AudioCraft项目地址：——、

Bark是由Suno创建的文本提示生成音频模型。Bark可以生成高度逼真的多语言语音以及其他音频 - 包括音乐，背景噪音和简单

Bark是由Suno创建的文本提示生成音频模型。Bark可以生成高度逼真的多语言语音以及其他音频-包括音乐，背景噪音和简单的音效。该模型还可以产生非语言交流，如笑、叹息和哭泣。Bark已经过测试，可以在CPU和GPU上运行（CUDA11.7和CUDA12.0）。pytorch2.0+，可用于商业用途。链接：https://github.com/suno-ai/bark标签：#AI#语音合成群聊：@appmiu

Meta公司发布开源AI作曲项目 MusicGen

Meta公司发布开源AI作曲项目MusicGenMeta的MusicGen可以根据文本提示生成短小的音乐片段，还可以选择性地与现有的旋律对齐。和大多数当前的语言模型一样，MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样，MusicGen预测音乐作品中的下一个部分。研究人员使用Meta的EnCodec音频分词器将音频数据分解成更小的组件。作为一个单阶段模型，它可以并行处理标记，因此MusicGen快速而高效。团队使用了20,000小时的授权音乐进行训练。特别是他们依赖于一个内部数据集，其中包括10,000首高质量的音乐曲目，以及来自Shutterstock和Pond5的音乐数据。——

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型，进一步向音频领域拓展，推出了，可以基于用户输入的提示词，生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于transforms扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。StableAudioOpen目前已经开源，感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长3分钟的完整音频。来源，频道：@kejiqu群组：@kejiquchat

谷歌 AI 功能升级，将允许用户根据文本提示直接创建图片

谷歌AI功能升级，将允许用户根据文本提示直接创建图片从本周四开始，谷歌推出利用人工智能驱动的生成搜索体验(SearchGenerativeExperience，简称SGE)创建图像。例如，用户想为一位喜欢烹饪且最喜欢的动物是水豚的朋友制作一张卡片，可以利用该功能搜索类似“画一张戴着厨师帽和烹饪早餐的水豚的图片”，SGE将在结果中提供最多四个生成的图像。用户可以根据搜索结果进一步编辑描述并添加更多细节，将自己的愿景变为现实。以上AI新功能现已加入谷歌的，用户可以通过谷歌应用或Chrome客户端注册并申请体验。来源，频道：@kejiqu群组：@kejiquchat

Meta 推出独立的人工智能图像生成器，目前免费但只支持英文提示词

Meta推出独立的人工智能图像生成器，目前免费但只支持英文提示词Meta在网页上推出了一种新的、独立的生成式人工智能体验「」，它允许用户通过用自然语言描述图像来创建图像。新的人工图像生成器由Meta现有的Emu图像生成模型提供支持，可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用，并且每个提示都会生成四个图像。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人