看了一下谷歌发布的 Muse

看了一下谷歌发布的 Muse - 可以快速生成图像,与 Stable Diffusion 等扩散模型相比,3.7s > 1.3s - 可以对图片里的多个物体进行同时的修改(图2) - 可以对蒙版区域进行生成(图3和4) - 对语言理解的能力更强,降低咒语学习难度 然而谷歌未发布代码,理由:可能被恶意使用

相关推荐

封面图片

Stability AI 发布单幅图像生成 3D 对象的 Stable Zero123

Stability AI 发布单幅图像生成 3D 对象的 Stable Zero123 Stability AI 发布了能根据单幅图像生成对象各个角度视图的模型 Stable Zero123。Stable Zero123 是基于 Stable Diffusion 1.5,生成一个视图消耗的内存与 Stable Diffusion 1.5 相同,但如果要生成 3D 视图需要更多时间和更多内存,建议 24GB。Stable Zero123 目前只支持研究目的的非商业使用。代码和权重发布在上。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

Stable Audio Open 开源 AI 模型发布

Stable Audio Open 开源 AI 模型发布 Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 ,可以基于用户输入的提示词,生成高质量音频样本。 Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。 Stable Audio Open 目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。Stability AI 公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。 Stable Audio Open 和 Stable Audio 2.0 不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长 3 分钟的完整音频。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

高通发布了一段视频,首次展示了在Android智能手机上运行的Stable Diffusion来创建图像。| 对应的模型是FP3

高通发布了一段视频,首次展示了在Android智能手机上运行的Stable Diffusion来创建图像。| 对应的模型是FP32 version 1-5open-source model,通过优化使其在搭载骁龙8Gen2移动平台的手机上运行。可以在15秒内在智能手机上运行Stable Diffusion进行20个推理步骤以生成512x512像素的图像。

封面图片

LLM 相关的基础文章很多人整理,AI 图像生成的比较少,刚好发现了一个,我又自己筛选了一下,一共 15 篇内容,都在这里了,如

LLM 相关的基础文章很多人整理,AI 图像生成的比较少,刚好发现了一个,我又自己筛选了一下,一共 15 篇内容,都在这里了,如果想深入研究 SD,建议看看。 主要包括三个部分:图片生成简介、图像生成基础模型的精细调整和构建 AI 生成服务,。 都放在下面的这个个链接里,打开一个就都有了。元旦我也会找时间把这些内容翻译一下,然后发出来,可以收藏这条回来看。等不及可以直接看,下面是具体的分类和文章目录: 图像生成技术简介: ◆ 人工智能和艺术:机器学习如何改变创造性工作(报告) ◆ 平面设计师如何创建他们自己的AI工具(博客文章) ◆ AI图像生成器的工作原理以及扩散是什么(视频) ◆ 什么是Diffusion模型?(视频) ◆ Diffusion模型的工作原理(1小时课程) ◆ 初学者指南:Stable diffusion(指南) 基础模型的精细调整: ◆ SD1.5通用目的模型的全面精细调整指南(博客文章) ◆ SD模型的基准测试与混合(博客文章) ◆ 解耦文本编码器和UNET学习率(博客文章) ◆ D适应:再见学习率困扰?(博客文章) ◆ 自己精细调整通用稳定扩散模型指南(博客文章) 构建 AI 生成服务的后端: ◆ 如何构建一个生成AI服务的后端 ◆ Stable diffusion提示:权威指南 ◆ SD提示的精细调整:修改Stable diffusion提示的GPT 3.5(博客文章) ◆ SD提示的目录(目录) 所有内容链接:

封面图片

Lexica在线Stable Diffusion prompt,文本生成图像搜索引擎,文本生成图像检索的平台,Lexica目前包

Lexica 在线Stable Diffusion prompt,文本生成图像搜索引擎,文本生成图像检索的平台,Lexica目前包含1000W+ 张由 Stable Diffusion 模型生成的网络图片和提示语prompt,这些prompt描述语可以直接复制,搜索的时候只需要输入关键词,就能查看它相关的网络用户创作艺术图

封面图片

Image to Prompt,一个根据图片生成Stable Diffusion提示词的网站,支持PNG和JPG格式的图片,最大

Image to Prompt,一个根据图片生成Stable Diffusion提示词的网站,支持PNG和JPG格式的图片,最大支持4MB,上传图片后点击Generate prompt,稍等片刻即可生成Stable Diffusion提示词,可以直接复制使用。 AI根据图片生成提示词 Image to Prompt:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人