Midjourney 今天上线了/describe,也就是 V6 版本的图片提示词生成能力,图片分析能力比 V5 的强很多。

Midjourney 今天上线了/describe,也就是 V6 版本的图片提示词生成能力,图片分析能力比 V5 的强很多。 然后发现 alpha 网站居然也可以使用/describe了,就是藏的比较深,于是录了一个视频演示一下。 生成的提示词会包括三部分第一部分是主体,然后是艺术家风格和描述词。 主体的部分通常会一次生成四条,不要全部用,描述词和艺术家的部分可以按需选择。 这里使用 alpha 网站,需要用 MJ 生成超过 1000 张图:

相关推荐

封面图片

MidJourney Prompt Helper MidJourney 提示词生成

MidJourney Prompt Helper MidJourney 提示词生成 链接: 要让人工智能生成的图片满足预期,就要想好提示词怎么写。这款工具可以输入自己的创意,上传带风格的图片、设置各种参数,生成对应的 MidJourney 提示词。

封面图片

#Midjourney V6上线

#Midjourney V6上线 一些反馈发现(单簧管总结): - 提示词长度现在是350+ - 您可以指定颜色和其他细节 - 你可以在画布上放置你想要的东西,如添加文本 - 您可以提示多个主题 - 你可以像ChatGPT一样和Midjourney聊天 - V6能够理解标点和语法的细微差别(即:熊猫吃、射、走) - 可以使用V6制作niji那样的漫画 - 可以通过描述图像来为其添加框架或边框 如何启用:在 /settings 下拉菜单中选择 V6,或在提示后输入 v 6。 官方对V6 模型的新特性: 1、更准确的提示跟随和更长的提示 •改进的响应能力:V6 模型对用户输入的响应更加准确,能够更好地理解和执行复杂的提示。 •处理更长的提示:V6 能够处理更长的文本提示,这意味着用户可以提供更详细的描述和指令,从而获得更精确的输出结果。 2、提升的连贯性和模型知识 •改善的连贯性:V6 在生成内容时的连贯性得到了显著提升,这使得输出结果更加流畅和自然。 •增强的模型知识:V6 拥有更丰富的知识库和更好的理解能力,能够更准确地处理复杂的查询和任务。 3、改进的图像提示和混合 •增强的图像生成:V6 在图像生成方面的能力得到了增强,能够根据文本提示创建更精细和逼真的图像。 •改善的图像混合:V6 提供了更好的图像混合功能,使得不同元素和风格的结合更加和谐自然。 4、文本绘制能力 •用户可以在他们的提示中指定要在图像上显示的文本,模型将会根据这些指示在生成的图像中包含相应的文本内容。 •绘制文本:V6 可以在图像中绘制文本。为了获得最佳效果,文本应该用引号标出。这样做可以帮助模型区分哪些是描述性的提示,哪些是实际要在图像中呈现的文本。 •风格调整:使用 style raw 或较低的 stylize 值可能有助于提高文本绘制的准确性和质量。这是因为不同的风格设置可能会影响文本在图像中的呈现方式。 例如,如果用户想要生成一张图像,上面写着用马克笔在便利贴上写的“Hello World!”,他们可以使用类似于以下的提示:“/imagine a photo of the text 'Hello World!' written with a marker on a sticky note ar 16:9 v 6”。

封面图片

Image to Prompt,一个根据图片生成Stable Diffusion提示词的网站,支持PNG和JPG格式的图片,最大

Image to Prompt,一个根据图片生成Stable Diffusion提示词的网站,支持PNG和JPG格式的图片,最大支持4MB,上传图片后点击Generate prompt,稍等片刻即可生成Stable Diffusion提示词,可以直接复制使用。 AI根据图片生成提示词 Image to Prompt:

封面图片

Midjourney V5 深度剖析与测评

Midjourney V5 深度剖析与测评 主要想详细介绍一下V5升级之后如何使用以及一些使用的注意事项。同时对V5在各个方面的能力做了详细的测试总结了一些要点。原文提供了流动金属的8K壁纸下载和图片的详细提示词。详细的内容在这里: 下面是量子速度版本: 如何使用V5版本 一种是直接在提示词后面加上 v 5 命令; 另一种是通过输入 命令回车后,选择MJ version V5的模型版本 V5的新功能 更广泛的风格范围:以前实现不了的一些风格V5会支持,比如非常明显的一个改变,以前V4版本在绘制照片风格的图片时总是有很明显的涂抹感现在生成的图片会更加逼真。 更具响应性的提示:第一个就是官方在公告里说的这次测试的是V5的专业模式对提示词的输入非常敏感,简短的提示可能效果不佳。第二个是V5貌似可以更好的理解自然语言,自然语言书写的提示词会比原来V4的关键词分割效果更好。另一个提示词理解能力的提升可以很好的理解数学概念和空间关系。 更高质量的图像:V5生成的图片在2倍分辨率放大时拥有更高的分辨率,这个因为目前 V5 的upsampler功能还没有开放。 动态范围改善:当你拍摄的图像在光线上有巨大的差异时,更大的动态范围就能获得更大的影调空间。涉及到从室外拍摄室内的内容的时候如果动态范围不足的时候图片就很容易特别黑细节不足,V5就表现的很好。 图像更详细:V5对于图像相关内容的细节会更加丰富,不需要加诸如“详细的”这类关键词,也可以生成正常的细节比如下面的图。 改进了图像提示性能:性能上的明显感觉V5发送完提示词以后相应更快了,之前V4发送完会等待模型理解提示词才会开始生成图片,V5几乎是发送完立刻就会开始生成图片。 支持无缝平铺:具体表现就是在提示词后加上tile 参数后可以生成无缝的纹理贴图。 支持大于 2:1 的纵横比:代表着你可以输出4:1甚至5:1的超宽屏图像或者全景图。 支持权衡图像提示与文本提示:在提示词后面输入 iw 加数字命令。数字越大生成的图片就会跟原图越像,数字越小就会跟原图差异越大。 V5我发现的新特性 画手的成功率大幅提升:不只是张手这种简单的手势不会出问题,握手、OK之类的手势出问题的现象也变得很少。

封面图片

Sora 的图片生成能力也非常牛皮。

Sora 的图片生成能力也非常牛皮。 早上拿手机看还没发现,在写实照片生成上的美学表现和细节已经比 Midjourney V6 要强了,这模型真的离谱。 注意看人脸的绒毛和皱纹。 Invalid media:

封面图片

一套Niji提示词,Niji V6挺有意思的,s的值和是否开Raw格式对画面风格和生成内容的影响非常大,感兴趣可以自己改一下提示

一套Niji提示词,Niji V6挺有意思的,s的值和是否开Raw格式对画面风格和生成内容的影响非常大,感兴趣可以自己改一下提示词的参数看看。 提示词的服装和人物特征部分都可以随便改,杂志和背景的部分不改就行。 提示词:k-pop girl, beautiful face, chubby, cyan hue, barcode, belt, black nails, green eyes, bracelet, cover, cover page, earrings, english text, fake cover, jewelry, short hair, bodysuit, shiny stocking, long sleeves, looking at viewer, magazine cover, nail polish, white hair, simple background, white background ar 9:16 style raw niji 6

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人