早上尝试Stable Cascade的时候,试了几张图发现 SC 模型生成图片质量比 SDXL 刚发布的时候好不少。#ai画图#

早上尝试StableCascade的时候,试了几张图发现SC模型生成图片质量比SDXL刚发布的时候好不少。于是就做了一个更详细的测试,SC和Midjoureny使用完全相同的提示词,Midjoureny不是用特殊的参数,一次生成4张,各选出一张比较好的进行测试。下面是对应的测试图,先说我的结论:在写实场景SC生成的内容在美学表现上和细节上跟Midjourney差别不是很大,细节上差一些,偶尔可以替代使用。SC由于模型规模的原因对于一些概念的理解不够,提示词响应比SDXL好但是比Midjourney要差。整体美学表现上相比SDXL更发布的时候有大幅提高,虽然还是不如Midjourney,但是风格表现上很相似,估计拿MJ图片做的训练。

相关推荐

封面图片

Midjourney危险了!Stable Diffusion最强模型SDXL已上线(含保姆级体验教程)!

Midjourney危险了!StableDiffusion最强模型SDXL已上线(含保姆级体验教程)!看到没多少人写sdxl,这里我就给想尝鲜的朋友,写一个如何快速体验SDXL效果的教程。免下载模型,sdxl体验步骤:https://mp.weixin.qq.com/s/Fz7U355XxmkrAztn84CNcA1、sd为什么会搞出sdxl?这次,SD看着营收上亿的Mj,终于坐不住了。它发布了全新模型SDXL1.0,号称是“迄今为止最牛逼的图像生成大模型”。那你肯定好奇,为什么会搞出这样一个产品?很简单,SD看到Mj赚了几个亿坐不住了。我要是sd,我现在大腿都要拍肿了。人家mj十几个人居然搞出来了上亿美元的收入,你sd那么多的人还在亏损???这不对标mj搞出个史诗级的新模型,你家投资人都坐不住了。毕竟,搞研究是要花钱的,这次的sdxl很显然就是冲着后续抢用户+收费来的。2、SDXL体验+测评效果总结根据我的经验,SDXL是一个过渡期的产品,想要尝鲜的朋友一定不要错过。首先要给第一次接触的朋友讲一下,作为一个拥有35亿参数基础模型和66亿参数模型的生物。这个SDXL到底比之前几个版本的sd牛逼在哪里?(1)对撰写提示词的要求大大降低。除了提示词更加精简之外,它的效果主要是体现在不需要质量提升词和负面提示词上。你不需要输入masterpiece这些常见的品质优化词,就可以实现非常棒的画面效果。同样的,你也不必像之前那样输入大量的负面提示词,来控制ai对画面的生成。比如最常见的手部结构出问题,是大家能识别ai的好方法,而现在ai更加能够生成无缺陷的手部结构了。(2)加强了对自然语言的理解能力。这个其实也是为了解决目前撰写提示词上的痛点,比如目前ai绘画的提示词都是一个个用逗号连接起来的词条。而到了SDXL这个版本,即使你输入一连串的自然对话,它也可以理解了。也就是说,写提示词这件事儿,真的会越来越简单了。(3)支持更大尺寸的照片,分辨率高很多。比如你可以直接生成1024x1024大小的图片了。之前你想直接出这类高清图片其实需要使用高清修复或者其他方法才能达到。(4)ai终于会写字了。SDXL已经能识别和生成文字了。

封面图片

【好文推荐】《优化 Stable Diffusion XL 的终极指南》#ai画图#

【好文推荐】《优化StableDiffusionXL的终极指南》详细介绍和测试了SDXL的模型优化方式,可以让SDXL在低显存显卡上稳定运行。同时大幅提高生成速度降低图像质量的损失。推荐有部署和优化SDXL需求的朋友收藏阅读,写的真的很好。--------详细介绍-------该文详细介绍了如何优化StableDiffusionXL(SDXL)以在任何显卡上获得最佳质量和性能。文章的核心目标是通过不同的优化技术,使SDXL能够在仅使用6GB内存的情况下生成图像,从而允许使用低端显卡。作者使用HuggingFace的diffusers库进行脚本编写和开发,旨在让读者了解和应用这些优化技术,以便在各种应用中,如Automatic1111的StableDiffusionwebUI或特别是ComfyUI中,充分利用它们。测试使用RunPod平台在SecureCloud上生成了一个搭载RTX3090显卡的GPUPod进行。文章比较了不同优化技术的性能,包括感知图像质量、生成每张图像所需时间、以及使用的最大内存量。优化技术包括CUDA和PyTorch版本选择、注意力机制优化、FP16、TF32、以及多种管道优化技术,如模型CPU卸载、批处理处理、StableFast、DeepCache和TensorRT。文章的结论部分提供了一个表格,总结了所有测试的结果,并提供了在寻求质量、速度或在内存限制下运行推理过程时的建议。例如,FP16优化通过使用半精度浮点格式显著降低了内存使用量并提高了计算速度,而StableFast项目通过运行时优化显著提高了推理速度。DeepCache通过使用缓存系统在保持较小的内存使用增加的同时,大幅减少了推理时间,但可能会略微降低图像质量。总的来说,这篇文章为那些希望在不同硬件配置下优化StableDiffusionXL性能的开发者提供了一份详尽的指南,展示了通过各种优化技术实现性能提升的可能性。文章地址:

封面图片

研究人员测试了热门的大语言模型的版权侵权情况

研究人员测试了热门的大语言模型的版权侵权情况新创AI模型评估公司PatronusAI周三发布了一个API,用于检测大语言模型版权内容的CopyrightCatcher(版权捕手)。同时该公司还展示了热门的AI模型生成受版权保护内容的频率。Patronus仅使用美国受版权保护的书籍来测试模型,并从编目网站Goodreads中选择流行的书籍。研究人员设计了100种不同的提示语,让模型以续写或输出第一页的方式回应。OpenAI的GPT-4表现最差,在44%的提示上生成了受版权保护的内容,Mixtral为22%。Anthropic的Claude2为8%,Meta的Llama-2为10%。总体来说所有模型,无论开源闭源都生成了受版权保护的内容,暗示了其训练数据中可能也使用了这些数据。OpenAI曾在今年早些时候表示,如果没有受版权保护的作品,“不可能”训练顶级人工智能模型。——、

封面图片

又一个Transformer架构的图像生成模型,FiT 专门为了生成不瘦分辨率和宽高比限制的图像制作的架构。#ai画图#

又一个Transformer架构的图像生成模型,FiT专门为了生成不瘦分辨率和宽高比限制的图像制作的架构。在模型的训练和推理都不需要专门适配对应的图片比例和分辨率。看演示的图像模型的美学表现也还行。-----项目简介-----推出了一种名为灵活视觉变换器(FlexibleVisionTransformer,简称FiT)的新型变换器架构。它专门设计用于创造没有分辨率和宽高比限制的图像。不同于传统的将图像看作固定分辨率网格的方法,FiT将图像视为一系列可变大小的图像块(Token)。这种独特的处理方式使得FiT能够在训练和应用过程中灵活适应不同的图像宽高比,提高了对不同分辨率的适应能力,并避免了由于裁剪图像而产生的偏差。FiT还通过精心设计的网络结构和一些不需要额外训练的技术,能够在图像分辨率的扩展方面展现出极大的灵活性。通过一系列全面的实验,FiT证明了其在处理各种不同分辨率的图像方面具有卓越的性能,无论是在其训练的分辨率范围内还是超出这一范围,都表现出色。项目地址:

封面图片

Stability AI试图通过新的图像生成人工智能模型保持领先地位

StabilityAI试图通过新的图像生成人工智能模型保持领先地位StableCascade可以生成照片,并对所创建的图片进行修改,或尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括内画和外画(模型只对图片的特定部分进行填充编辑),以及可视边缘(用户可利用现有图片的边缘制作新照片)。根据提示"一张拟人企鹅坐在咖啡馆里看书喝咖啡的电影照片"生成的StableCascade图像。新模型可在GitHub上供研究人员使用,但不能用于商业用途。在Google甚至苹果等公司发布自己的图像生成模型时,新模型也带来了更多选择。与Stability的旗舰产品StableDiffusion模型不同,StableCascade并不是一个大型语言模型,而是三个不同的模型,它们都依赖于Würstchen架构。StableCascade与其他模型的推理时间比较将请求分解成更小的比特后,请求所需的内存更少(在那些很难找到的GPU上训练的时间也更少),运行速度更快,同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要10秒,而目前使用的SDXL模型需要22秒。StabilityAI公司帮助普及了StableDiffusion方法,同时也成为了几起诉讼的对象,这些诉讼指控StableDiffusion公司在未经权利人许可的情况下对受版权保护的数据进行了训练-Getty图片公司对StabilityAI公司的诉讼将于12月开庭审理。该公司于12月开始通过订阅的方式提供商业许可,并表示这是帮助其研究获得资金所必需的。...PC版:https://www.cnbeta.com.tw/articles/soft/1418229.htm手机版:https://m.cnbeta.com.tw/view/1418229.htm

封面图片

DALL-E 3已经在Bing中实装了,我大概测试了一下,真的很强特别是提示词的理解方面比Midjourney强太多了,某些方面

DALL-E3已经在Bing中实装了,我大概测试了一下,真的很强特别是提示词的理解方面比Midjourney强太多了,某些方面的生成质量也跟MJ差不多,肯定是比SDXL要好非常多的。MidjourneyV6要是再不出,感觉危险了,而且DALL-E3还是免费的。下面是一些实验和对应的提示词(左MJ右DALL-E3),感兴趣可以自己去试着玩玩提示词:Perfumebottlecoveredwithplumblossoms,JamesTurrellstyle,premiumperfumebottle,renderedincinema4d,minimalistproductdesign,uniqueartdesign,productposter,conceptart,elegantbalanceSummernights,Theyellowmoon,street,Therewasacutelittlegirlwithacat,cityroad,atmosphere;Full,cutedoodle,thicklineartbyMrDoodleAbstractandminimalCMYKharajukufashionphotographyfromY2Kwithlotsofblur,doubleexposure,Awomanwhoiscoveringherhandsupwithherhandsassheholdsherhandsinlight,inthestyleofshige'svisualaestheticstyle,portraitswithsoftlighting,motekei,hauntingshadows,prismaticportraits,distinctfacialfeatures,国内的话访问Bing需要强制国外IP才行,打开之后输入“创建一张图像:提示词”就可以了。速度还非常快,妈的感觉MJ的订阅要降一个档,换成10美元的了。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人