Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频

StabilityAI推出StableAudio,基于文本生成最长90秒音频StabilityAI公司近日推出StableAudio,可以基于用户输入的文本内容,自动生成音乐或者音频。免费版StableAudio可以生成最长20秒的音乐片段,而用户在购买Pro订阅之后,可以生成最长90秒的音频内容。StabilityAI公司首席执行官表示:“我们希望音乐爱好者和创意专业人士使用StableAudio工具,帮助生成新的内容,并期待能够激发无限的创造力”。https://stability.ai/blog/stable-audio-using-ai-to-generate-music——

相关推荐

封面图片

Stability AI 推出音乐/声音生成人工智能 Stable Audio

StabilityAI推出音乐/声音生成人工智能StableAudioStableAudio是一个扩散模型,用户只需描述关键词即可创建自己想要的音乐,每个账户每个月可以免费生成20首音频。StableAudio由音乐商AudioSparx提供的超80万音频文件训练而来(包含音乐、音效、单乐器主干和对应文本)。该模型在英伟达A100显卡上可以以44.1kHz采样率在不到一秒的时间内渲染95秒的音频。stableaudio.com投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

StableAudio2.0发布:生成最长3分钟音频,能帮音乐家补全创意作品StabilityAI宣布推出StabilityAudio2.0,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成3分钟的音频内容。StableAudio2.0扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段DEMO,要求StableAudio2.0补充完整歌曲,让你的各种小创意都能转换为完整的音频内容。StableAudio2.0还支持定制、微调生成后的音频内容,换句话说,如果你不喜欢音频中的某些内容,你可以根据自己的具体需求改变风格。StabilityAudio2.0不仅能生成完整的音轨,还能帮助您制作各种声音和音频效果,从打字时发出的声音到人群背景声等等。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型,进一步向音频领域拓展,推出了,可以基于用户输入的提示词,生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。StableAudioOpen目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长3分钟的完整音频。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Stability AI 推出 Stable Video Diffusion 模型,可根据图片生成视频

StabilityAI推出StableVideoDiffusion模型,可根据图片生成视频StableVideoDiffusion这款模型能够通过现有图片生成视频,是基于之前发布的StableDiffusion文本转图片模型的延伸,也是目前为止市面上少有的能够生成视频的AI模型之一。不过,这款模型目前并不是对所有人开放的。StableVideoDiffusion目前处于StabilityAI所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款,其中规定了StableVideoDiffusion的预期应用场景(例如“教育或创意工具”、“设计和其他艺术过程”等)和非预期的场景(例如“对人或事件的事实或真实的表达”)()投稿:@ZaiHuaBot频道:@TestFlightCN

封面图片

太惊艳了,昨天 Stability AI 推出了文生音频领域的大杀器:Stable Audio

太惊艳了,昨天StabilityAI推出了文生音频领域的大杀器:StableAudio从放出的几个音乐demo来看完成度非常高,甚至有汉斯季默的味道用prompt的方式写歌,描述音乐流派、乐器、画面、感觉就可以产生一段音乐demo。https://www.stableaudio.com/能想到很多应用,比如很多助眠类App可以不用花钱买音乐了,影视制作,up主等等...而且相比于SD糟糕的webui,StablilityAI也许怕出现再一个midjourney,这次C端设计做得也十分优雅。整个网站设计透露优秀的平面设计审美。Stability从扔掉画师的饭碗开始砸音乐家饭碗Invalidmedia:

封面图片

Stability AI推出适用于普通电脑的文本生成图像模型SD3 Medium

StabilityAI推出适用于普通电脑的文本生成图像模型SD3MediumStabilityAI今天宣布基于SD3推出了新版本SD3Medium版,该版本只有2B参数,适合在消费级设备上使用。SD3Medium同样免费,属于开放但非开源的模型,如果需要商业性使用应当购买授权。下载链接:关注频道@ZaiHuaPd频道爆料@ZaiHuabot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人