[实践] Comfyui 官方又对 Stable Cascade进行了更新，原来需要下载 7 个模型现在开源社区将其整合为了两个

[实践]Comfyui官方又对StableCascade进行了更新，原来需要下载7个模型现在开源社区将其整合为了两个，只需要选择C阶段和B阶段的模型文件就行。同时Comfyui官方还放出了多种StableCascade玩法的示例工作流，包括文生图、图生图、图片融合。这次更新之后用合并的模型生成图片质量和美观度上都很不错，我都是直接用的Midjourney的提示词。就是还有个问题，生成的图片都有伪影，这个比较离谱，非常影响画面效果。希望过段时间可以修复一下。工作流及模型下载：

在Telegram中查看

相关推荐

开源社区对Stable Cascade的支持非常迅速，不过现在使用Stable Cascade的成本还是有些高的，起码需要 12

开源社区对StableCascade的支持非常迅速，不过现在使用StableCascade的成本还是有些高的，起码需要12G显存。同时Comfyui官方会在本周六前支持StableCascade。这里有其他人的测试图片，还有StableCascade的各种使用渠道。一个使用StableCascade的ComfyUI插件：一个只需要12G显存就能运行StableCascade的ComfyUI插件：一个A1111WebUI上运行StableCascade的插件：

Reddit 上的一个帖子，很厉害，利用简陋的 3D 模型动画和 Animatediff 生成高度自定义的 2D 动画。#ai

Reddit上的一个帖子，很厉害，利用简陋的3D模型动画和Animatediff生成高度自定义的2D动画。B站前段时间胶囊计划有个片子也是类似的处理方式。具体的工作流为：将文本转化为3D效果:由LumaLabs提供技术支持背景设计:使用ComfyUI和Photoshop的生成式填充功能3D动画制作:采用Mixamo和Blender工具2D风格动画:由ComfyUI提供支持所有其他特效:通过AfterEffects实现

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型，进一步向音频领域拓展，推出了，可以基于用户输入的提示词，生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于transforms扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。StableAudioOpen目前已经开源，感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示：“虽然它可以生成简短的音乐片段，但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是，前者为开源模型，专注于短音频片段和音效，而后者能够生成最长3分钟的完整音频。来源，频道：@kejiqu群组：@kejiquchat

早上尝试Stable Cascade的时候，试了几张图发现 SC 模型生成图片质量比 SDXL 刚发布的时候好不少。#ai画图#

早上尝试StableCascade的时候，试了几张图发现SC模型生成图片质量比SDXL刚发布的时候好不少。于是就做了一个更详细的测试，SC和Midjoureny使用完全相同的提示词，Midjoureny不是用特殊的参数，一次生成4张，各选出一张比较好的进行测试。下面是对应的测试图，先说我的结论：在写实场景SC生成的内容在美学表现上和细节上跟Midjourney差别不是很大，细节上差一些，偶尔可以替代使用。SC由于模型规模的原因对于一些概念的理解不够，提示词响应比SDXL好但是比Midjourney要差。整体美学表现上相比SDXL更发布的时候有大幅提高，虽然还是不如Midjourney，但是风格表现上很相似，估计拿MJ图片做的训练。

已经有人发布了第一个基于Stable Cascade微调的模型HelloWorld SC 1B。#ai画图#

已经有人发布了第一个基于StableCascade微调的模型HelloWorldSC1B。看起来效果不错，不过还是没有比SDXL好太多目前微调SC模型的成本也很高。这个模型总共使用了740张真实的训练图像，涵盖肖像、科幻等主题。所有图像均使用我们的开源GPT4V标记器进行标记。使用的显卡是一张48GVRAMRTX6000ada。总训练时间为3.5小时。上述参数在训练时会占用约45G的显存。下面是一些作者的图片示例，这里下载模型：

图像生成模型 Stable Diffusion XL 1.0 开源发布

图像生成模型StableDiffusionXL1.0开源发布SDXL1.0的性能5倍优于SD1.5(开源社区主流)，是开源世界最大参数的图像模型，也是StabilityAI最新&最先进的模型。现可通过Github、HuggingFace、API、AWS、Clipdrop、DreamStudio直接访问。SDXL1.0拥有3.5B参数的基础模型(可单独使用)和6.6B参数的专家混合管道(多了一个单独执行最终去噪的精炼模型)，精炼模型可以为基础模型的输出添加更准确的颜色、更高的对比度和更精细的细节。微调SDXL1.0的图像需求量也急剧下降，现在只需5到10张图像就可以快速微调出一个专门生成特定人物、事物的模型。投稿：@ZaiHuaBot频道：@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人