Stable Diffusion 是人工智能公司 Stability AI 背后的文本到图像模型,于 2022 年 8 月发布。

StableDiffusion是人工智能公司StabilityAI背后的文本到图像模型,于2022年8月发布。StabilityAI首席执行官EmadMostaque表示,StableDiffusion在所有渠道拥有超过1000万用户。如果我们推断一下《Midjourney》的数据和趋势,就会发现,通过官方的StableDiffusion渠道,用户每天会生成200万张图片,而在发布一年多的时间里,这个数字已经达到了6.9亿张图像。如果加上其他流行模型(例如Runway,我们单独统计)和StabilityAI的官方渠道,使用StableDiffusion创建的图像数量将增加到125.9亿张,占所有使用文本转文字创建的AI图像的80%。AdobeFireflyAdobeAdobe推出了Firefly,于2023年3月发布。上线6周内,用户创建了超过1亿资产。随着Firefly于2023年5月集成到AdobePhotoshop,考虑到全球使用Photoshop的人数,图像数量呈指数级增长。Adobe在最新的新闻稿中分享了其AI图像统计数据:推出仅3个月,使用AdobeFirefly创建的图像数量就已达到10亿张。使用StableDiffusion、AdobeFirefly、Midjourney和DALLE-2总共生成了超过150亿张人工智能创建的图像。这比Shutterstock的整个照片、矢量图和插图库还要多,而且是Instagram上传的图片数量的三分之一。

相关推荐

封面图片

Stability AI发布最新图像生成模型Stable Diffusion XL 1.0

StabilityAI发布最新图像生成模型StableDiffusionXL1.0今天,StabilityAI宣布推出StableDiffusionXL1.0,这是该公司迄今为止描述为“最先进”的文本到图像模型。StableDiffusionXL1.0可在上以开源形式使用,并提供给Stability的和消费者应用程序和。Stability声称,与其前代产品相比,StableDiffusionXL1.0提供了“更生动”和“更准确”的颜色,更好的对比度、阴影和照明效果。在接受采访时,StabilityAI的应用机器学习负责人JoePenna指出,StableDiffusionXL1.0包含35亿个参数,可以“在几秒钟内”生成多种长宽比的100万像素分辨率的完整图像。“参数”是模型从训练数据中学习到的部分,基本上定义了模型在解决问题上的技能水平。上一代稳定扩散模型稳定扩散XL0.9也可以生成更高分辨率的图像,但需要更多的计算能力。——、

封面图片

Stability AI 宣布 Stable Diffusion 3

StabilityAI宣布StableDiffusion3AI创业公司StabilityAI宣布其最新一代的文本图像模型StableDiffusion3开放预览。感兴趣的用户可以申请加入等候名单。StabilityAI称开放预览是为了在正式发布前收集与性能和安全性相关的用户反馈。StableDiffusion3模型的参数规模从8亿到80亿不等,其架构组合了diffusiontransformer和flowmatching,技术报告将在晚些时候公布。来源,频道:@kejiqu群组:@kejiquchat

封面图片

Stability AI试图通过新的图像生成人工智能模型保持领先地位

StabilityAI试图通过新的图像生成人工智能模型保持领先地位StableCascade可以生成照片,并对所创建的图片进行修改,或尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括内画和外画(模型只对图片的特定部分进行填充编辑),以及可视边缘(用户可利用现有图片的边缘制作新照片)。根据提示"一张拟人企鹅坐在咖啡馆里看书喝咖啡的电影照片"生成的StableCascade图像。新模型可在GitHub上供研究人员使用,但不能用于商业用途。在Google甚至苹果等公司发布自己的图像生成模型时,新模型也带来了更多选择。与Stability的旗舰产品StableDiffusion模型不同,StableCascade并不是一个大型语言模型,而是三个不同的模型,它们都依赖于Würstchen架构。StableCascade与其他模型的推理时间比较将请求分解成更小的比特后,请求所需的内存更少(在那些很难找到的GPU上训练的时间也更少),运行速度更快,同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要10秒,而目前使用的SDXL模型需要22秒。StabilityAI公司帮助普及了StableDiffusion方法,同时也成为了几起诉讼的对象,这些诉讼指控StableDiffusion公司在未经权利人许可的情况下对受版权保护的数据进行了训练-Getty图片公司对StabilityAI公司的诉讼将于12月开庭审理。该公司于12月开始通过订阅的方式提供商业许可,并表示这是帮助其研究获得资金所必需的。...PC版:https://www.cnbeta.com.tw/articles/soft/1418229.htm手机版:https://m.cnbeta.com.tw/view/1418229.htm

封面图片

Stability AI推出Stable Diffusion 3 提示文本理解更好、图像质量更强

StabilityAI推出StableDiffusion3提示文本理解更好、图像质量更强StableDiffusion3的参数在8亿——80亿之间,也就是说StableDiffusion3可能是专为移动设备开发的,AI算力消耗将更低,推理速度却更快。目前,StableDiffusion3支持申请使用,未来会扩大测试范围。申请地址:https://stability.ai/stablediffusion3stability.ai没有过多的介绍StableDiffusion3的技术内容,但指出其核心架构使用了Transformer和FlowFMatching(简称“FM”)。Transformer大家都很熟悉了,ChatGPT、T5 、BERT等很多著名模型都是基于该架构开发的。而FM是MetaAI和魏茨曼科学研究所在2022年10月发布的,一种全新高效建模、训练技术概念。FlowMatching论文地址:https://arxiv.org/abs/2210.02747FlowMatching简单介绍目前,很多文生图模型使用的是CNF(连续正规化流动)训练方法,主要使用常微分方程对流动进行建模,实现从一种已知分布到目标分布的平滑映射。但由于训练过程需要进行大量的微分方程模拟,会导致算力成本高、模型设计复杂、可解释性差等缺点。FM则是放弃微分方程的直接模拟,而是通过回归固定条件概率轨迹来实现无模拟训练。研究人员设计了条件概率分布与向量场的概念,利用边缘分布的结合可以建立总体目标概率轨迹与向量场,从而消除了模拟过程对梯度计算的影响。1)条件概率路径构建:FM需要给出一个目标概率路径,该路径从简单分布演变到逼近数据分布。然后利用条件概率路径构建了目标路径,这样每个样本有一个对应的条件路径。2)变换层:构成FM的基本单元,每个变换层都是可逆的。这意味着从输入到输出的每一步映射都可以精确地反转,从而允许从目标分布反推到原始分布。3)耦合层:将输入分成两部分,对其中一部分应用变换,而变换函数可以是任意的神经网络,其参数由另一部分决定,保证了变换的可逆性。目前,FM技术已在图像生成与超分辨率、图像理解、图像修复与填充、条件图像生成、图像风格迁移与合成、视频处理等领域得到广泛应用。StableDiffusion3案例展示本次的发布页面也是由StableDiffusion3生成的,提示词:史诗般的动漫艺术风格,一位巫师站在夜间的山顶上,向黑暗的天空施放咒语,上面写着由彩色能量生成的“StableDiffusion3”文字教室桌子上有一个红苹果,电影风格,背景的黑板上用粉笔写着“要么做大,要么回家”一名宇航员骑着一只穿着蓬蓬裙的猪,撑着一把粉色的伞,猪旁边的地上有一只戴着高帽的知更鸟,角落里写着"StableDiffusion"的字样。一只变色龙,黑色背景,摄影风格。一辆跑车的夜间照片,侧面写有“SD3”字样,汽车在赛道上高速行驶,巨大的路标上写着“更快”的文字。波浪冲击苏格兰灯塔的鱼眼镜头照片,黑色波浪。...PC版:https://www.cnbeta.com.tw/articles/soft/1420259.htm手机版:https://m.cnbeta.com.tw/view/1420259.htm

封面图片

Stable Diffusion 的母公司 Stability AI 宣布开源一款全新的大语言模型

StableDiffusion的母公司StabilityAI宣布开源一款全新的大语言模型StableLM模型的Alpha版本有30亿和70亿参数,并将于后续开放150亿和650亿的参数模型。StabilityAI的创始人EmadMostaque自2020年从OpenAI团队离开后,一直秉承着开源开放的理念,持续推出了多款AI开源模型。其中影响力最广的,便有大家所熟知的文本生成图像模型StableDiffusion。本次开源的StableLM,基础功能跟GPT一样,支持生成文本和代码,在未来可以给不少应用提供基础技术支持。在项目中,StableLM提供了几个基础演示,包括聊天、撰写书信、小说创作、代码编写等功能。来源(,)来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

Stability AI 发布 Stable Video Diffusion

StabilityAI发布StableVideoDiffusionAI创业公司StabilityAI发布了它的视频生成模型StableVideoDiffusion,源代码采用MITLicense发布在上,权重发布在HuggingFace上。StableVideoDiffusion基于StableDiffusion,有两种输出形式,能以每秒3-30帧的定制帧速生成14和25帧。StabilityAI称其模型的表现好于私有模型。来源,频道:@kejiqu群组:@kejiquchat

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人