太惊艳了,昨天 Stability AI 推出了文生音频领域的大杀器:Stable Audio

太惊艳了,昨天StabilityAI推出了文生音频领域的大杀器:StableAudio从放出的几个音乐demo来看完成度非常高,甚至有汉斯季默的味道用prompt的方式写歌,描述音乐流派、乐器、画面、感觉就可以产生一段音乐demo。https://www.stableaudio.com/能想到很多应用,比如很多助眠类App可以不用花钱买音乐了,影视制作,up主等等...而且相比于SD糟糕的webui,StablilityAI也许怕出现再一个midjourney,这次C端设计做得也十分优雅。整个网站设计透露优秀的平面设计审美。Stability从扔掉画师的饭碗开始砸音乐家饭碗Invalidmedia:

相关推荐

封面图片

Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频

StabilityAI推出StableAudio,基于文本生成最长90秒音频StabilityAI公司近日推出StableAudio,可以基于用户输入的文本内容,自动生成音乐或者音频。免费版StableAudio可以生成最长20秒的音乐片段,而用户在购买Pro订阅之后,可以生成最长90秒的音频内容。StabilityAI公司首席执行官表示:“我们希望音乐爱好者和创意专业人士使用StableAudio工具,帮助生成新的内容,并期待能够激发无限的创造力”。https://stability.ai/blog/stable-audio-using-ai-to-generate-music——

封面图片

Stability AI推出Stable Diffusion 3 提示文本理解更好、图像质量更强

StabilityAI推出StableDiffusion3提示文本理解更好、图像质量更强StableDiffusion3的参数在8亿——80亿之间,也就是说StableDiffusion3可能是专为移动设备开发的,AI算力消耗将更低,推理速度却更快。目前,StableDiffusion3支持申请使用,未来会扩大测试范围。申请地址:https://stability.ai/stablediffusion3stability.ai没有过多的介绍StableDiffusion3的技术内容,但指出其核心架构使用了Transformer和FlowFMatching(简称“FM”)。Transformer大家都很熟悉了,ChatGPT、T5 、BERT等很多著名模型都是基于该架构开发的。而FM是MetaAI和魏茨曼科学研究所在2022年10月发布的,一种全新高效建模、训练技术概念。FlowMatching论文地址:https://arxiv.org/abs/2210.02747FlowMatching简单介绍目前,很多文生图模型使用的是CNF(连续正规化流动)训练方法,主要使用常微分方程对流动进行建模,实现从一种已知分布到目标分布的平滑映射。但由于训练过程需要进行大量的微分方程模拟,会导致算力成本高、模型设计复杂、可解释性差等缺点。FM则是放弃微分方程的直接模拟,而是通过回归固定条件概率轨迹来实现无模拟训练。研究人员设计了条件概率分布与向量场的概念,利用边缘分布的结合可以建立总体目标概率轨迹与向量场,从而消除了模拟过程对梯度计算的影响。1)条件概率路径构建:FM需要给出一个目标概率路径,该路径从简单分布演变到逼近数据分布。然后利用条件概率路径构建了目标路径,这样每个样本有一个对应的条件路径。2)变换层:构成FM的基本单元,每个变换层都是可逆的。这意味着从输入到输出的每一步映射都可以精确地反转,从而允许从目标分布反推到原始分布。3)耦合层:将输入分成两部分,对其中一部分应用变换,而变换函数可以是任意的神经网络,其参数由另一部分决定,保证了变换的可逆性。目前,FM技术已在图像生成与超分辨率、图像理解、图像修复与填充、条件图像生成、图像风格迁移与合成、视频处理等领域得到广泛应用。StableDiffusion3案例展示本次的发布页面也是由StableDiffusion3生成的,提示词:史诗般的动漫艺术风格,一位巫师站在夜间的山顶上,向黑暗的天空施放咒语,上面写着由彩色能量生成的“StableDiffusion3”文字教室桌子上有一个红苹果,电影风格,背景的黑板上用粉笔写着“要么做大,要么回家”一名宇航员骑着一只穿着蓬蓬裙的猪,撑着一把粉色的伞,猪旁边的地上有一只戴着高帽的知更鸟,角落里写着"StableDiffusion"的字样。一只变色龙,黑色背景,摄影风格。一辆跑车的夜间照片,侧面写有“SD3”字样,汽车在赛道上高速行驶,巨大的路标上写着“更快”的文字。波浪冲击苏格兰灯塔的鱼眼镜头照片,黑色波浪。...PC版:https://www.cnbeta.com.tw/articles/soft/1420259.htm手机版:https://m.cnbeta.com.tw/view/1420259.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人