按照Midjourney的官方文档里的说法,并不一定:
Promptscanbeverysimple.Singlewords(orevenanemoji!)willproduceanimage.VeryshortpromptswillrelyheavilyonMidjourney’sdefaultstyle,soamoredescriptivepromptisbetterforauniquelook.However,super-longpromptsaren’talwaysbetter.Concentrateonthemainconceptsyouwanttocreate.
如果你看完我的教程,你会发现我讲的例子里,很多图只要很少的prompt就能描述清楚,生成的图片也不差。
当然我并不是说,不能写很长的prompt,如果你生成的内容本来就很复杂,那写长一点也没所谓,但写完问问自己,这有必要吗?
说到游戏,我最喜欢的风格是像素风,像素风格一般有:
各位都可以自己试试,介绍一个我写的prompt,最近塞尔达发布了最新作《王国之泪》,很喜欢他们的天空岛的设定,所以用Midjourney生成了一个16-bitpixelart版本:
再生成一个宠物小精灵的场景:
这两个prompt都很短,但很有意思,可玩性挺强的,各位可以多玩玩:
因为篇幅的原因,我无法将所有有关3D游戏的prompt都介绍完,我只能挑选一些我比较喜欢的风格讲一下,而且我不是专业的3D设计师,所以未免会有讲错的地方,望见谅。
在3D场景设计里,我最喜欢的应该是像素风3D微缩场景,也不知道是不是叫这个名字,写一个prompt给大家看看:
以下左图是火星工厂,右图是机器人实验室:
我用以上prompt生成了达斯维达和风暴兵的,我觉得风暴兵还挺可爱的:
游戏装备非常非常多,我没法一一给大家介绍,只介绍一些我了解的,首先是戒指,多大数的游戏戒指都是那种印章戒指(signetring),
另外一个可能常见的是装备集(我不确定这个中文是否正确,英文叫ItemCollections),写法是这样的:
最后生成的结果如下,但我对装备集的生成不是很满意,后面我会介绍一个技巧,教大家如何渐进优化生成的图片:
很多人把AI生成图片比喻为炼丹,我觉得非常贴切,很多时候,也不知道为啥,在prompt里加一点神秘配方,图片就会很不一样。
不过我觉得虽然过程很像炼丹,但并不代表我们需要像古人那样,用撞大运的方式炼制丹药。我认为目前使用Midjourney最好的方法是:控制变量渐进优化法。
拿上面那个装备集的图片为例,我希望它生成的是装备,并且是一件件地排布,而且光剑的效果也很奇怪,首先我们来逐条排查prompt:
从这个表里可以看到,我们发现了三个问题,其中第一个黏土风格问题,跟最后一个问题有关,此时我的建议是:
OK,按照以上原则,我们修改一下我们的prompt,看看生成了什么,的确加了differenttypesof后,光剑就多了,问题解决了:
然后我们修改下blender3d,将其改为clayrender(黏土渲染),我改完之后发现生成的结果(左边四张),好像质感还是差了一点,于是我又试了下保留3dblender加oily的效果(中间四张),以及clayrender加oily两个一起用(右边四张)。
我个人觉得好像两个都改了效果是最好的(右边四张)。
对比一下最开始的prompt生成的图片,是不是最终的图片效果更好?所以这个技巧主要想告诉大家,写prompt没有必要照抄答案,你也有能力自己写好prompt。
游戏这一章,再介绍一个可能会用到的一个场景人物设定稿,prompt如下:
最后的结果如下:
我有用ChatGPT辅助我生成提示词,但没有用Role模式,而是让它:
我为何没有用Role模式?
的确,让ChatGPT以Role模式帮我生成内容,比较省时省力,但我个人觉得:
不过,这也是我一家之言,如果你觉得这样效率更高,那就用吧~
没啥关系,适合自己的工具才是好工具。
OK言归正传,从本章开始,我们会逐步丰富我们的prompt框架,让图片有更多的细节。实物生成的第一个是场景是玩具,是个非常有意思的场景。
另外,这个场景如果能跟3D打印机结合一下,我觉得会非常赞。不知道有没有有志之士能实现一下。
再解释下prompt有哪些更新,从实物这张开始,我讲「背景」调整为「环境」,即主体环境,包括背景、灯光等等:
另外一个是游戏王里的蓝眼白龙,可惜Midjourney并不知道啥是Yu-Gi-Oh,只能按字面意思生成了一个:
以下是生成的图片:
另外,我发现Midjourney对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:
说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在prompt里加入Japanesestyle即可,拿圣女贞德作手办,以及之前做的logo作为例子:
圣女贞德是不是有种FF的感觉?Logo也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了Japanese还有Chinese(左边4张),甚至AfricanStyle:
各位有没有发现,上面那个Chinese手办生成的结果好像只有第三张是中国人面孔?原因是Chinesestyle的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI忽略了某些prompt词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。
那为何会产生这样的结果?原因Midjourney的prompt权重是按照顺序逐个降低(详情请见我翻译的Midjourney官方FAQ),在我们上面的prompt,我们将ChineseStyle放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。
增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的ChineseStyle放到最前面(然后生成的结果就是眯眯眼style了,我生成了两次,第二次好一些):
productphotography,ChineseStyle,JoanofArc,fullbody,handpainted,plastic,detailed,whitebackground,studiolighting调整下顺序,效果就大不一样,所以各位不要迷信所谓的prompt模板,多试试。
第二种方法是Slider方法。
你需要在prompt最后加,然后加上你需要调整权重的词语,接着再加,最后加上权重值。比如还是上面的例子,我想突出Chinesestyle但不想调整顺序,就可以改为:
productphotography,JoanofArc,fullbody,handpainted,plastic,detailed,whitebackground,studiolighting,ChineseStyle::ChineseStyle::0.5然后你会发现,好像权重太高了,生成了跟prompt无关的图(下方左图),那我们可以在原来的基础上,再加以下JoanofArc的权重(下方右图):
productphotography,JoanofArc,fullbody,handpainted,plastic,detailed,whitebackground,studiolighting,ChineseStyle::JoanofArc::0.25styleofChinese::0.5你可以看到,调整参数后,生成的4张图有2张具备较强的Chinese风格:
不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序,ROI会更高一些,这个方法更适合miss掉某个prompt词时使用,比如官方的案例是这样的:
severalsadcatswatchacryingwomaninahome-officeenvironmentwithlaptop生成的图片里(左四张图),猫咪们都看着你(你可能才是cryingwoman),如果用slider的功能(右边四张),cryingwoman就出现在画面里了:
severalsadcatswatchacryingwomaninahome-officeenvironmentwithlaptop::severalsadcats::0.5cryingwoman::0.6laptop::0.7另外需要注意,slider可用的参数有0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是-0.7、-0.6、-0.5、-0.25:
如果你用了slider还是没有出现应该有的画面,那还有一个大招cowbell,坦率说来,这个并不符合Midjourney的官方最佳实践,但的确是个可行的方法,以下面这个prompt为例,生成的图片里,woman看起来并不shy(左边四张图):
Asongbirdsitsontheshoulderofashyblondewomandressedinwhite.此时你可以重复重复再重复(我觉得这就是为何这个方法叫cowbell的原因):
另一个我比较喜欢的实物是食物,食物讲究的是「色香味俱全」,所以在描述食物类的prompt时,可以往这三个方向想想:
然后再来一碗红烧牛肉面:
言归正传,摄影中,常用摄影灯光有以下几种:
这算是V5的新特性,Midjourney在V5版本认识很多名人,你可以在描述主体的时候,加上名人的名字,就可以生成该名人的照片,我们生成几个电影里的经典照片:
第一个是KeanuReeves,第二个是VitoCorleone(我并没有输入主演人MarlonBrando),两组图的prompt都非常简单,你可以尝试自己写一下
本章最后有答案。
做衣服类电商的朋友可能会比较需要这个功能:
坦率说来,我觉得Midjourney应该是可以的,但目前的效果还不太好,要想实现这个需求,只需要用到前面介绍的技巧九里提到的blend功能,详细方法就不在这赘述了,大致就是我将商品图和人物图用blend功能融合了下:
为了验证一致性,我生成了几张Reeves的图分别尝试了下,最后输出的结果是这样的:
整体来看,好像还行,但真的用在商品描述图里,我觉得还不太可能,因为里面的衣服跟原图差距还比较大(可以细看里面的纽扣)。
但我觉得未来Midjourney可能会优化好这个功能,并且我觉得如果可以自己训练模型,这个功能实现起来应该不难。
这个算是名人照片的分支玩法,最近大家应该看到过很多类似的照片,其实prompt很简单,主体和背景大家用翻译软件搞搞就行:
用类似的prompt生成了两组图片:
上面的老照片场景,我们用了1990s风格,严格地说,这个1990s更适合放在主体,或者环境里,放在风格里也不是不行,因为不仅仅希望主体是1990s还希望图片生成的风格也是1990s。
这就是最后一种风格词用法:年代。
拿插画那一章的两个prompt修改一下,我都没在prompt里加艺术家的名字,而是改为styleof1920s,玫瑰的图有点那味,猫的图右上角那张太逗了。
Reeves很简单,就是说明主体,然后注明穿着标志性的衣服,走在大雨里:
KeanuReeves,wearingablacklongleathercoat,walkingdownthestreetintherain然后教父的那张就更简单了:
VitoCorleonesittingonachair技巧十五:如何让Midjourney生成的人更具有多样性?这里的多样性其实是指人的高矮胖瘦,甚至身体的一些特殊性等。
不知道各位有没有发现,大多数用AI生成的图片,人物都非常漂亮和英俊,但这并不好,这其实某种程度上代表了社会的偏见。
所以我想在本章重点介绍下,如何让Midjourney生成更多样的人体。
方法一:Slider方法
在上一章,我介绍了增加权重的方法,这个方法还可以帮助你生成不同体型的人物,以下是Midjourney官方社区的案例:
Plus-sizedgingerfemaledressedinbohemianvest,maxiskirt,espadrilles,walkingacrossautumncampuscourtyard,morningatmosphere::plus-sized::-0.3--ar2:3你可以控制plus-sized后面的参数,从而使画面中的人物变胖或者变瘦。这里需要注意,并不是负数就是越瘦的意思,而是削弱了plus-sized权重,如果你的prompt词是thin你加个负数slider参数那就是变胖了:
方法二:直接描述
Midjourney是知道一些多样性的词语的,比如:
实物和人物介绍完,介绍一下风景。坦率说来,我并不擅长摄影,所以这三章写得可能会不太专业。我更多地是介绍方法,以及告知大家可能性。
如果有不对的地方,请见谅。
风景大片,我觉得大家应该都在各大平台看过了,所以本章不会介绍太多常见的风景制作方法。而是介绍一些少见的,我这里介绍一个比较有趣的类型:
另外还制作了一个火星工厂:
另外,我还很喜欢用这个效果制作一些多肉植物的照片,主体只要填写:cuteminiHaworthiacymbiformisplantinapot,或者cuteminiAloeplantinapot:
严格说来,这个不算风景,但因为我实在不知道该放哪里,所以还是放到风景这了。
右边是FrankGehry:
如果你对建筑感兴趣,不妨试试两种风格的建筑融合在一起试试,说不定会碰撞出有意思的设计。
可能有些朋友用过一些手机App,它并不像PS工具那样,允许你修改图片的白平衡等参数,而是让你体验用旧相机(如胶卷相机)拍照,虽然本质上来说,它也是通过各种参数来模拟当年的相机效果,但的确挺有意思的。
在Midjourney里,你也可以通过增加相机或者镜头的名称,从而达到类似的效果。根据我的实验,Midjourney可以改变以下几类:
我很喜欢双重曝光的效果,以及长曝光:
不过各位使用时,需要根据自己的场景选择合适的相机和镜头,比如无人机视角,都不太适合拍近物:
刚好,在写这一章的时候,Midjourney发布了其Niji的V5版本,所以我以下prompt我都会在—niji5的参数下运行。
我这里就不罗列了,详细的列表可以看我整理的List或者直接去Midlibrary,它们总结的是真的好。
这个用到我们之前教的img2img功能,你只需要在prompt里加入图片URL,然后加上以下prompt即可(为了更像原图,我加了iw参数):
panelfrommanga--iw2另一个我加了NaokoTakeuchi(美少女战士的作者),模型还是不善于生成人手:
本章节主要是介绍几个我很喜欢,但不知道如何归类的场景。
不过我写完这一章,我发现他们都很适合变现,比如制作实体货物啥的
不知道有没有人和我一样有喜欢买贴纸贴笔记本电脑的习惯。某宝虽厉害,但我希望的东西比较非主流,有一些无法满足我的需求,所以就想到让AI帮我画一些,以下用风暴兵和达斯维达为例,写一组prompt:
生成的结果是这样的,你会发现就是多了一个白边,并且是矢量图风格(我觉得很适合某宝的朋友用):
我非常喜欢那种有层次的剪纸风格(中文应该叫啥呢?我只知道英文叫layeredpaperart)但这种要画出来,还挺困难的,于是想着用AI试试:
用上述的prompt生成的结果还挺不错的,但如果你看下图左边4张图中的第3张,会觉得框里的球很不现实,也不是我想要的那种2D堆叠的剪影,第2张和第4张更像是我想要的,修改一下,加个diorama(二维平面图)。
voilà~加上后效果好很多(右边4张),太漂亮了,希望某宝有卖:
不知道各位是否还知道邮票这种东西,2023年了,我还有集邮的习惯,所以我在想用AI生成邮票估计也很有意思,所以就试了下,让AI做几张星球大战的复古邮票:
最后生成的图片,简直就是艺术:
最后介绍一些海报的做法:
最简单的方法,当然就是直接问。
如果问不到,倒是可以借助一些工具,Midjourney支持图片转prompt功能。方法很简单。第一步在输入框输入/describe:
点击describe后,会弹出一个添加文件的入口,上传文件,并点击回车。
Midjourney就会返回结果,点击图片下方的1、2、3、4按钮,可以直接发prompt给bot,让其生成图片,右边是分别用#1和#4prompt生成的图片,我觉得用它来探寻原图的构图、主体、风格应该都不错,但不要预期能生成一个完全一样的图:
经过几个专题的学习,我们基本将textprompt框架里包含的元素都过了一遍,但大家可能会觉得内容不好记忆,所以本章我会对框架进行总结。
官方的模板很简单,分成四个部分:
其实按照官方模板写,你已经能超过90%的初学者,但根据我的实验,我细化了他们的模板的,有以下调整:
我用一个表格总结下这个框架,各位可以根据不同场景有选择地使用。
这个模板看起来很长,但它跟各位拍照其实很像(只是顺序做了权重优化),各位想想自己的整个拍照的过程,是不是: