Skip to main content

Midjourney 各版本差异

V1、V2、V3、V4、V5

我们都用相同的 prompt 来看看各版本的差异,我使用的是官方案例里的 prompt:

vibrant California poppies

MJ017.png

从上图里其实你就能看到 Midjourney 的进化方向:

  1. 越来越丰富的细节,生成的内容也越来越真实。V1 和 V2 基本上就是简笔画,看看 V2 第四张图前景和背景的处理就很粗暴,到了 V3 背景和透视都变得更加合理,然后到了 V4 基本就是一个可用的状态。
  2. 分辨率越来越高。V1~V3 单张图是 256 x 256,到了 V5 单图已经默认是 1024*1024。
  3. 参数更多,Prompt 更加重要。这个在 V5 版本更加明显,感觉以前的版本,并不太能理解一些词,比如材料词 marble 之类的。但到了 V5 理解能力变强了。
  4. 艺术风格词变得更重要。这个结论暂时没有得到官方的认证,甚至有很多人认为 V5 版本是个更「通用」的版本,我的理解是 V5 提高了整个基准线,不需要太多描述词,就能生成一个「可以看」的图片,但如果要生成一张你跟你预期完全一致的图,其实变难了,你需要了解更多的 prompt。

然后我们再来看看更复杂的 prompt 看看版本的差异:

21years chinese girl, in school, beauty, long black hair, sun light,insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM

看看生成的结果,是不是差距非常大,从 V1 到 V5 的进化,Midjourney 大约花了 1 年的时间,如果仅算研发时间,我觉得应该不到 1 年,非常了不起:

MJ018.png

Niji

最后再介绍一个 Midjourney 的特殊版本 Niji,这个版本其实是 Midjourney 跟 Spellbrush 一起开发的。「niji」是日语「にじ」,意思是「彩虹」 或者 「2D」。

它在生成动漫类的图片上,比较在行。举个例子,prompt 是 fancy peacock,左图是 v5 模型,右图是 niji v5模型,右图更偏向于漫画风格:

MJ127.png