[实践] Comfyui 官方又对 Stable Cascade进行了更新,原来需要下载 7 个模型现在开源社区将其整合为了两个

[实践]Comfyui官方又对StableCascade进行了更新,原来需要下载7个模型现在开源社区将其整合为了两个,只需要选择C阶段和B阶段的模型文件就行。同时Comfyui官方还放出了多种StableCascade玩法的示例工作流,包括文生图、图生图、图片融合。这次更新之后用合并的模型生成图片质量和美观度上都很不错,我都是直接用的Midjourney的提示词。就是还有个问题,生成的图片都有伪影,这个比较离谱,非常影响画面效果。希望过段时间可以修复一下。工作流及模型下载:

相关推荐

封面图片

开源社区对Stable Cascade的支持非常迅速,不过现在使用Stable Cascade的成本还是有些高的,起码需要 12

开源社区对StableCascade的支持非常迅速,不过现在使用StableCascade的成本还是有些高的,起码需要12G显存。同时Comfyui官方会在本周六前支持StableCascade。这里有其他人的测试图片,还有StableCascade的各种使用渠道。一个使用StableCascade的ComfyUI插件:一个只需要12G显存就能运行StableCascade的ComfyUI插件:一个A1111WebUI上运行StableCascade的插件:

封面图片

Reddit 上的一个帖子,很厉害,利用简陋的 3D 模型动画和 Animatediff 生成 高度自定义的 2D 动画。#ai

Reddit上的一个帖子,很厉害,利用简陋的3D模型动画和Animatediff生成高度自定义的2D动画。B站前段时间胶囊计划有个片子也是类似的处理方式。具体的工作流为:将文本转化为3D效果:由LumaLabs提供技术支持背景设计:使用ComfyUI和Photoshop的生成式填充功能3D动画制作:采用Mixamo和Blender工具2D风格动画:由ComfyUI提供支持所有其他特效:通过AfterEffects实现

封面图片

Stable Audio Open 开源 AI 模型发布

StableAudioOpen开源AI模型发布StabilityAI立足StableDiffusion文生图模型,进一步向音频领域拓展,推出了,可以基于用户输入的提示词,生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。StableAudioOpen目前已经开源,感兴趣的用户可以在上试用。据说它使用了来自FreeSound和FreeMusicArchive等音乐库的486000多种采样进行训练。StabilityAI公司表示:“虽然它可以生成简短的音乐片段,但并不适合完整的歌曲、旋律或人声”。StableAudioOpen和StableAudio2.0不同是,前者为开源模型,专注于短音频片段和音效,而后者能够生成最长3分钟的完整音频。来源,频道:@kejiqu群组:@kejiquchat

封面图片

早上尝试Stable Cascade的时候,试了几张图发现 SC 模型生成图片质量比 SDXL 刚发布的时候好不少。#ai画图#

早上尝试StableCascade的时候,试了几张图发现SC模型生成图片质量比SDXL刚发布的时候好不少。于是就做了一个更详细的测试,SC和Midjoureny使用完全相同的提示词,Midjoureny不是用特殊的参数,一次生成4张,各选出一张比较好的进行测试。下面是对应的测试图,先说我的结论:在写实场景SC生成的内容在美学表现上和细节上跟Midjourney差别不是很大,细节上差一些,偶尔可以替代使用。SC由于模型规模的原因对于一些概念的理解不够,提示词响应比SDXL好但是比Midjourney要差。整体美学表现上相比SDXL更发布的时候有大幅提高,虽然还是不如Midjourney,但是风格表现上很相似,估计拿MJ图片做的训练。

封面图片

已经有人发布了第一个基于Stable Cascade微调的模型HelloWorld SC 1B。#ai画图#

已经有人发布了第一个基于StableCascade微调的模型HelloWorldSC1B。看起来效果不错,不过还是没有比SDXL好太多目前微调SC模型的成本也很高。这个模型总共使用了740张真实的训练图像,涵盖肖像、科幻等主题。所有图像均使用我们的开源GPT4V标记器进行标记。使用的显卡是一张48GVRAMRTX6000ada。总训练时间为3.5小时。上述参数在训练时会占用约45G的显存。下面是一些作者的图片示例,这里下载模型:

封面图片

图像生成模型 Stable Diffusion XL 1.0 开源发布

图像生成模型StableDiffusionXL1.0开源发布SDXL1.0的性能5倍优于SD1.5(开源社区主流),是开源世界最大参数的图像模型,也是StabilityAI最新&最先进的模型。现可通过Github、HuggingFace、API、AWS、Clipdrop、DreamStudio直接访问。SDXL1.0拥有3.5B参数的基础模型(可单独使用)和6.6B参数的专家混合管道(多了一个单独执行最终去噪的精炼模型),精炼模型可以为基础模型的输出添加更准确的颜色、更高的对比度和更精细的细节。微调SDXL1.0的图像需求量也急剧下降,现在只需5到10张图像就可以快速微调出一个专门生成特定人物、事物的模型。投稿:@ZaiHuaBot频道:@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人