Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

StableAudio2.0发布:生成最长3分钟音频,能帮音乐家补全创意作品StabilityAI宣布推出StabilityAudio2.0,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成3分钟的音频内容。StableAudio2.0扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段DEMO,要求StableAudio2.0补充完整歌曲,让你的各种小创意都能转换为完整的音频内容。StableAudio2.0还支持定制、微调生成后的音频内容,换句话说,如果你不喜欢音频中的某些内容,你可以根据自己的具体需求改变风格。StabilityAudio2.0不仅能生成完整的音轨,还能帮助您制作各种声音和音频效果,从打字时发出的声音到人群背景声等等。来源,频道:@kejiqu群组:@kejiquchat

相关推荐

封面图片

Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频

StabilityAI推出StableAudio,基于文本生成最长90秒音频StabilityAI公司近日推出StableAudio,可以基于用户输入的文本内容,自动生成音乐或者音频。免费版StableAudio可以生成最长20秒的音乐片段,而用户在购买Pro订阅之后,可以生成最长90秒的音频内容。StabilityAI公司首席执行官表示:“我们希望音乐爱好者和创意专业人士使用StableAudio工具,帮助生成新的内容,并期待能够激发无限的创造力”。https://stability.ai/blog/stable-audio-using-ai-to-generate-music——

封面图片

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型,进一步向音频领域拓展,推出了,可以基于用户输入的提示词,生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。StableAudioOpen目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长3分钟的完整音频。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Stability AI 推出音乐/声音生成人工智能 Stable Audio

StabilityAI推出音乐/声音生成人工智能StableAudioStableAudio是一个扩散模型,用户只需描述关键词即可创建自己想要的音乐,每个账户每个月可以免费生成20首音频。StableAudio由音乐商AudioSparx提供的超80万音频文件训练而来(包含音乐、音效、单乐器主干和对应文本)。该模型在英伟达A100显卡上可以以44.1kHz采样率在不到一秒的时间内渲染95秒的音频。stableaudio.com投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

开源声音与音乐生成模型AudioLDM2 只需提供文本即可生成高质量音频

开源声音与音乐生成模型AudioLDM2只需提供文本即可生成高质量音频项目地址:https://github.com/haoheliu/AudioLDM2相比传统的Concatenative方法,该模型可以生成更流畅连贯的音频。同时,相比基于GAN的方法,它生成的音频质量更高,更符合文本描述的语义。该工具提供了命令行接口和网页应用,非专业用户也可以轻松使用。用户可以选择不同的模型检查点,生成不同风格的音频。同时,调整随机种子也可以生成不同的音频样本。总之,这是一个强大且易用的文本到音频生成工具,可以广泛应用于音乐创作、音效生成、语音合成等领域。它极大地降低了音频内容生成的门槛,对创意行业有重大帮助。该模型的出现,无疑为音频处理领域注入了新的活力,并为相关行业提供了一种全新的解决方案。未来,这个模型的应用领域还可能进一步扩展,为我们的生活带来更多惊喜。...PC版:https://www.cnbeta.com.tw/articles/soft/1380491.htm手机版:https://m.cnbeta.com.tw/view/1380491.htm

封面图片

音乐生成软件Stable Audio最近更新了挺多东西的,越来越像一个正经工具而不是玩具了。

音乐生成软件StableAudio最近更新了挺多东西的,越来越像一个正经工具而不是玩具了。◆它现在可以根据你上传的音频来生成音乐。◆更新了一系列详细的设置帮助控制生成的音乐内容比如种子、步数、提示强度等。◆现在可以直接通过链接分享你生成的音乐。◆还可以吧生成的音乐下载成视频。◆还内置了提示词库帮助你书写提示词。这里尝试:https://stableaudio.com/user-guide#modelInvalidmedia:

封面图片

Stability AI发布免费音频生成工具 可创作AI歌曲

StabilityAI发布免费音频生成工具可创作AI歌曲而StableAudio2.0提供了完整的三分钟音频片段,这个长度的歌曲大多数适合电台播放,而所有上传的音频必须是无版权的。据了解,与OpenAI的音频生成模型VoiceEngine只向一小部分用户开放不同,StabilityAI通过其网站免费向公众提供StableAudio,未来将很快提供API接口。StabilityAI表示,StableAudio2.0与其早期版本的一个主要区别在于,它能够创建与真实歌曲相似的歌曲结构,包括有序幕、进展和尾声。不过,已经试玩StableAudio2.0的媒体表示,这个水平的AI歌曲距离帮助用户用音乐表达想法,差距依然比较大。例如,有用户用“带有美国风格的民谣流行歌曲”(美国乡村音乐)作为提示,StableAudio生成的歌曲在某些部分听起来有山谷清晨的氛围,并且疑似加入了人声。理论上,StableAudio2.0的新功能允许用户调整生成的AI音频作品,使作品更符合用户的听歌风格。例如可以调整遵循提示程度,或设置转换所上传音频的哪一部分,用户还可以添加像人群的吼声或键盘敲击等音效。然而,这种AI歌曲最大的问题在于,让人感觉毫无灵魂。但这并不令人感到惊讶,因为这和其他大厂的AI音频问题一样。例如,如Meta和Google也一直在尝试AI音频生成,但两家公司都没有公开发布他们的模型,因为他们仍在收集开发者的反馈,来解决AI歌曲无灵魂的问题。StabilityAI在一份新闻稿中说,StableAudio是在AudioSparx的数据上训练的,后者拥有超过800,000个音频文件的库。不过,这些音频可能出现版权纠纷。StabilityAI表示,作品被纳入AudioSparx的艺术家可以选择退出,以避免他们的作品用于训练模型。其实,使用版权音频训练模型是StabilityAI的前音频副总裁EdNewton-Rex在StableAudio发布后不久就离开公司的原因之一。对于2.0版本,StabilityAI说它与AudibleMagic合作,使用其内容识别技术来追踪和阻止版权音频进入平台。总之,StableAudio2.0的确让AI歌曲比之前更像真正的歌曲,但还是没有完全达到这个目标。媒体表示,如果StableAudio2.0模型坚持添加某种人声,也许下一个版本的AI音频作品会出现更能令人分辨的语言。...PC版:https://www.cnbeta.com.tw/articles/soft/1426117.htm手机版:https://m.cnbeta.com.tw/view/1426117.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人