Midjourney V5 深度剖析与测评
Midjourney V5 深度剖析与测评
主要想详细介绍一下V5升级之后如何使用以及一些使用的注意事项。同时对V5在各个方面的能力做了详细的测试总结了一些要点。原文提供了流动金属的8K壁纸下载和图片的详细提示词。详细的内容在这里:
下面是量子速度版本:
如何使用V5版本
一种是直接在提示词后面加上 v 5 命令;
另一种是通过输入 命令回车后,选择MJ version V5的模型版本
V5的新功能
更广泛的风格范围:以前实现不了的一些风格V5会支持,比如非常明显的一个改变,以前V4版本在绘制照片风格的图片时总是有很明显的涂抹感现在生成的图片会更加逼真。
更具响应性的提示:第一个就是官方在公告里说的这次测试的是V5的专业模式对提示词的输入非常敏感,简短的提示可能效果不佳。第二个是V5貌似可以更好的理解自然语言,自然语言书写的提示词会比原来V4的关键词分割效果更好。另一个提示词理解能力的提升可以很好的理解数学概念和空间关系。
更高质量的图像:V5生成的图片在2倍分辨率放大时拥有更高的分辨率,这个因为目前 V5 的upsampler功能还没有开放。
动态范围改善:当你拍摄的图像在光线上有巨大的差异时,更大的动态范围就能获得更大的影调空间。涉及到从室外拍摄室内的内容的时候如果动态范围不足的时候图片就很容易特别黑细节不足,V5就表现的很好。
图像更详细:V5对于图像相关内容的细节会更加丰富,不需要加诸如“详细的”这类关键词,也可以生成正常的细节比如下面的图。
改进了图像提示性能:性能上的明显感觉V5发送完提示词以后相应更快了,之前V4发送完会等待模型理解提示词才会开始生成图片,V5几乎是发送完立刻就会开始生成图片。
支持无缝平铺:具体表现就是在提示词后加上tile 参数后可以生成无缝的纹理贴图。
支持大于 2:1 的纵横比:代表着你可以输出4:1甚至5:1的超宽屏图像或者全景图。
支持权衡图像提示与文本提示:在提示词后面输入 iw 加数字命令。数字越大生成的图片就会跟原图越像,数字越小就会跟原图差异越大。
V5我发现的新特性
画手的成功率大幅提升:不只是张手这种简单的手势不会出问题,握手、OK之类的手势出问题的现象也变得很少。