[实践] Comfyui 官方又对 Stable Cascade进行了更新,原来需要下载 7 个模型现在开源社区将其整合为了两个

[实践] Comfyui 官方又对 Stable Cascade进行了更新,原来需要下载 7 个模型现在开源社区将其整合为了两个,只需要选择 C 阶段和 B 阶段的模型文件就行。 同时Comfyui官方还放出了多种Stable Cascade玩法的示例工作流,包括文生图、图生图、图片融合。这次更新之后用合并的模型生成图片质量和美观度上都很不错,我都是直接用的 Midjourney的提示词。 就是还有个问题,生成的图片都有伪影,这个比较离谱,非常影响画面效果。希望过段时间可以修复一下。 工作流及模型下载:

相关推荐

封面图片

ComfyUI官方已经支持了Stable Cascade的使用,试了一下没有感觉效果比SDXL好,可能得等微调了。

ComfyUI官方已经支持了Stable Cascade的使用,试了一下没有感觉效果比SDXL好,可能得等微调了。 下面链接有官方的工作流下载,我的4070Ti一张1024图片的生成时间是7秒,还可以。 部分插件可能会导致Stable Cascade工作流报错,如果报错的话可以暂时把所有插件备份,然后删掉尝试。 使用方式:

封面图片

开源社区对Stable Cascade的支持非常迅速,不过现在使用Stable Cascade的成本还是有些高的,起码需要 12

开源社区对Stable Cascade的支持非常迅速,不过现在使用Stable Cascade的成本还是有些高的,起码需要 12G 显存。 同时 Comfyui 官方会在本周六前支持Stable Cascade。 这里有其他人的测试图片,还有Stable Cascade的各种使用渠道。 一个使用Stable Cascade的ComfyUI 插件: 一个只需要 12G 显存就能运行Stable Cascade的 ComfyUI 插件: 一个 A1111 Web UI 上运行Stable Cascade的插件:

封面图片

Stable Audio Open 开源 AI 模型发布

Stable Audio Open 开源 AI 模型发布 Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 ,可以基于用户输入的提示词,生成高质量音频样本。 Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。 Stable Audio Open 目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自 FreeSound 和 Free Music Archive 等音乐库的 486000 多种采样进行训练。Stability AI 公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。 Stable Audio Open 和 Stable Audio 2.0 不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长 3 分钟的完整音频。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

昨天 Stable Cascade 创建图片有伪影的问题解决了,主要原因是我随便打得图像比例和分辨率不是Stable Casca

昨天 Stable Cascade 创建图片有伪影的问题解决了,主要原因是我随便打得图像比例和分辨率不是Stable Cascade支持的分辨率。 更换成 2048*1152 就没问题了,没有伪影的图片质量相当不错,下面是昨天同样提示词生成的四张图,2K 分辨率直出。

封面图片

ComfyUI的LayerDiffusion透明图层生成插件也已经发布了,目前还只支持生成。

ComfyUI的LayerDiffusion透明图层生成插件也已经发布了,目前还只支持生成。 插件主要有两个节点,工作流需要用的那个遮罩节点需要安装comfyui-tooling-nodes插件。 插件地址:

封面图片

Stability AI试图通过新的图像生成人工智能模型保持领先地位

Stability AI试图通过新的图像生成人工智能模型保持领先地位 Stable Cascade 可以生成照片,并对所创建的图片进行修改,或尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括内画和外画(模型只对图片的特定部分进行填充编辑),以及可视边缘(用户可利用现有图片的边缘制作新照片)。根据提示"一张拟人企鹅坐在咖啡馆里看书喝咖啡的电影照片"生成的Stable Cascade图像。新模型可在GitHub 上供研究人员使用,但不能用于商业用途。在Google甚至苹果等公司发布自己的图像生成模型时,新模型也带来了更多选择。与 Stability 的旗舰产品 Stable Diffusion 模型不同,Stable Cascade 并不是一个大型语言模型,而是三个不同的模型,它们都依赖于Würstchen 架构。Stable Cascade与其他模型的推理时间比较将请求分解成更小的比特后,请求所需的内存更少(在那些很难找到的 GPU 上训练的时间也更少),运行速度更快,同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要 10 秒,而目前使用的 SDXL 模型需要 22 秒。Stability AI公司帮助普及了Stable Diffusion方法,同时也成为了几起诉讼的对象,这些诉讼指控Stable Diffusion公司在未经权利人许可的情况下对受版权保护的数据进行了训练 - Getty图片公司对Stability AI公司的诉讼将于 12 月开庭审理 。该公司于 12 月开始通过订阅的方式提供商业许可,并表示这是帮助其研究获得资金所必需的。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人