ElevenLabs 支持通过提示词创建音效,例如爆炸或其他音效

ElevenLabs已经提供了由AI生成的人声和音乐。现在,它还允许人们为播客、电影或游戏创建音效。新的音效工具可以根据用户提示生成最长22秒的声音,这些声音可以与公司的语音和音乐平台结合使用,并为用户提供至少四种可下载的音频剪辑选项。该公司表示,他们与股票媒体平台Shutterstock合作,建立了一个音频库,并用这些音频片段来训练他们的模型。Shutterstock已经将其内容库授权给许多AI公司,包括OpenAI、Meta和Google。这些音效是免费使用的,但付费用户可以用生成的音频片段进行商业用途,而免费用户“必须在标题中注明‘elevenlabs.io’”。ElevenLabs用户在编写提示时有字符数限制,免费用户每月有10,000字符的额度。对于音效,ElevenLabs在其常见问题页面上表示,如果用户自己设置音频片段的时长,将从配额中每秒扣除40个字符。如果使用默认的音频时长,每次提示请求将扣除200个字符。标签:#ElevenLabs#AI频道:@GodlyNews1投稿:@GodlyNewsBot

相关推荐

封面图片

Meta 发布开源 AI 工具 AudioCraft,用户可通过文本提示创作音乐、音频

Meta发布开源AI工具AudioCraft,用户可通过文本提示创作音乐、音频Meta开源了一款生成式AI工具AudioCraft,可帮助用户通过文本提示创作音乐和音频。根据Meta官方介绍,AudioCraft包含了三个核心组件:1、MusicGen:使用Meta拥有/特别授权的音乐进行训练,根据文本提示生成音乐。2、AudioGen:使用公共音效进行训练生成音频或扩展现有音频,后续还可生成环境音效(如狗叫、汽车鸣笛、木地板上的脚步声)。3、EnCodec(改进版):基于神经网络的音频压缩解码器,可生成更高质量的音乐并减少人工痕迹,或对音频文件进行无损压缩。该工具经过开源之后,相关研究人员和从业人员可以使用自己的数据集训练模型。官方宣称AudioCraft系列模型能够长期稳定地生成高质量音频,而且易于使用,能够为音乐家和声音设计师“提供灵感”,帮助他们快速集思广益,并“以新的方式迭代他们的作品”。AudioCraft项目地址:——、

封面图片

Bark是由Suno创建的文本提示生成音频模型。Bark可以生成高度逼真的多语言语音以及其他音频 - 包括音乐,背景噪音和简单

Bark是由Suno创建的文本提示生成音频模型。Bark可以生成高度逼真的多语言语音以及其他音频-包括音乐,背景噪音和简单的音效。该模型还可以产生非语言交流,如笑、叹息和哭泣。Bark已经过测试,可以在CPU和GPU上运行(CUDA11.7和CUDA12.0)。pytorch2.0+,可用于商业用途。链接:https://github.com/suno-ai/bark标签:#AI#语音合成群聊:@appmiu

封面图片

Meta公司发布开源AI作曲项目 MusicGen

Meta公司发布开源AI作曲项目MusicGenMeta的MusicGen可以根据文本提示生成短小的音乐片段,还可以选择性地与现有的旋律对齐。和大多数当前的语言模型一样,MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样,MusicGen预测音乐作品中的下一个部分。研究人员使用Meta的EnCodec音频分词器将音频数据分解成更小的组件。作为一个单阶段模型,它可以并行处理标记,因此MusicGen快速而高效。团队使用了20,000小时的授权音乐进行训练。特别是他们依赖于一个内部数据集,其中包括10,000首高质量的音乐曲目,以及来自Shutterstock和Pond5的音乐数据。——

封面图片

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型,进一步向音频领域拓展,推出了,可以基于用户输入的提示词,生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。StableAudioOpen目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长3分钟的完整音频。来源,频道:@kejiqu群组:@kejiquchat

封面图片

谷歌 AI 功能升级,将允许用户根据文本提示直接创建图片

谷歌AI功能升级,将允许用户根据文本提示直接创建图片从本周四开始,谷歌推出利用人工智能驱动的生成搜索体验(SearchGenerativeExperience,简称SGE)创建图像。例如,用户想为一位喜欢烹饪且最喜欢的动物是水豚的朋友制作一张卡片,可以利用该功能搜索类似“画一张戴着厨师帽和烹饪早餐的水豚的图片”,SGE将在结果中提供最多四个生成的图像。用户可以根据搜索结果进一步编辑描述并添加更多细节,将自己的愿景变为现实。以上AI新功能现已加入谷歌的,用户可以通过谷歌应用或Chrome客户端注册并申请体验。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Meta 推出独立的人工智能图像生成器,目前免费但只支持英文提示词

Meta推出独立的人工智能图像生成器,目前免费但只支持英文提示词Meta在网页上推出了一种新的、独立的生成式人工智能体验「」,它允许用户通过用自然语言描述图像来创建图像。新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用,并且每个提示都会生成四个图像。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人