开局一张图,首图是我好多年前画的一幅画,最近实验拿出来让AIScribble一下,大家能看出来哪个是人工涂色,哪个是AI涂色么??
下面是我多方整理以及自己常用的一些标准提示词,在我的案例中,大家也基本能看出来,我经常用这些提示词。我按标准提示词、内容提示词、画幅构图视角、提示词的权重分配、正向提示词示例、反向提示词给大家都举了一些例子,欢迎尝试。
通用高画质:
masterpiece:杰作
nsanelydetailed,ultra-detailed,highlydetailed:疯狂的细节,超精细的细节绘制
bestquality:高质量
特定高分辨率类型:
HDQuality:高清
8k:8k高清
sharpfocus:焦点清晰
unrealenginerendered:虚幻渲染
画家风格:
19世纪肖像画家:JohnCollier
偏写实和现代风格:StanleyArtgermLau
擅长女性肖像,偏印象派:JohnSingerSargent
擅长画平面肖像:AlphonseMucha
画风:
插画风:illustration,painting,paintbrush
二次元:anime,comic,gameCG
写实系:photorealistic,realistic,photograph,Ultrarealisticillustration
肖像画风:Portrait用于生成脸部或者头像
数字艺术风格:Digitalpainting
2D插图风格:Conceptart
Ultrarealisticillustration
风格:
印象派:hyperrealistic
超现实主义:fantasy
波普艺术:surrealist
人物及主体特征:
精致的脸,清晰的脸:exquisiteface,clearface
服饰搭配:whitedress
发型发色:blondehair,longhair
五官特点:smalleyes,bigmouth
面部表情:smiling
肢体动作:stretchingarms
人物皮肤:(highdetailedskin:1.2)
场景特征:
室内/室外:indoor/outdoor
大场景:forest,city,street
小细节:tree,bush,whiteflower
环境光照:
白天黑夜:day/night
特定时段:morning,sunset
光环境:sunlight,bright,dark
天空:bluesky,starrysky
十种基础构图关键词:
对称构图:Symmetricalcomposition
对角线构图:diagonalcomposition
水平线构图:horizontalcomposition
散点构图:Scatteredcomposition
遮挡构图:blockingcomposition
线条构图:Linecomposition
仰拍构图:upside-downcomposition
俯拍构图:perspectivecomposition
对比构图:Contrastcomposition
架构式构图:framecomposition
距离:close-up,distant
其他一些常用的提示词:
人物比例:fullbody,upperbody
观察视角:fromabove,viewofback
aerialview/aerialphotography/overheadshot---鸟瞰,做一些宏达的场景俯视图
镜头类型:wideangle,sonyv7
适合景色的一些构图:
massivescale宏伟场景构图
Epiclevelcomposition史诗级构图
streetlevelview路人视角
lushvegetation茂盛的植被
idyllic田园般的
Mattepainting当总是远景,希望有近景,景深一点
blurrybackground背景虚化
括号+数字:
(redflower:1.5):调节redflower出现的权重是原来的1.5倍,加强。
(redflower:0.5):调节redflower出现的权重是原来的0.5倍,减弱。
套括号:
((redflower)):每套一层,权重1.1倍,此处表示调节redflower出现的权重是原来的1.11.1倍,加强。
{{redflower}}:每套一层,权重1.05倍,此处表示调节redflower出现的权重是原来的1.051.05倍,加强。
[[redflower]]:每套一层,权重0.9倍,此处表示调节redflower出现的权重是原来的0.90.9倍,加强。
((masterpiece)),((nsanelydetailed)),((intricate)),((exquisiteface))illustration,abeautifulyounggirl,fullbody,standing,whitedress,perfectlighting
常用模板:画质标准+风格+人物特征要求+光线
一般写你不希望画面中出现的内容。
watermark水印
Low/worstquality低质量
Logo标识文字
NSFW不需要的属性
个人常用的反向提示词1:
NSFW,lowrs,blurry,(deformed,distorted,disfigured:1.3),(stackedtorsos:1.2),(totempole:1.1),poorlydrawn,badanatomy,wronganatomy,missingarms,missinglegs,extraarms,extralegs,fusedfingers,toomanyfingers,longneck,extralimb,missinglimb,floatinglimbs,(mutatedhandsandfingers:1.4),disconnectedlimbs,mutation,mutated,ugly,disgusting,blurry,amputation,(extrafingers:1.2),(worstquality,lowquality:1.3)outofframe,worstquality,lowquality,jpegartifacts,ugly,duplicate,morbid,mutilated,mutation,deformed,blurry,dehydrated,badproportions,extralimbs,clonedface,disfigured,grossproportions,malformedlimbs
个人常用的反向提示词2:
NSFW,outofframe,worstquality,lowquality,jpegartifacts,ugly,duplicate,morbid,mutilated,extrafingers,mutatedhands,poorlydrawnhands,poorlydrawnface,mutation,deformed,blurry,dehydrated,badanatomy,badproportions,extralimbs,clonedface,disfigured,grossproportions,malformedlimbs,missingarms,missinglegs,extraarms,extralegs,fusedfingers,toomanyfingers,longneck
没有人物时常用的反向提示词:
NSFW,outofframe,worstquality,lowquality
下面再给大家看个实际的例子吧.
1、不加任何画质、风格的提示词。
大模型选择:sd1.5基础大模型
提示词:abeautifulyounggirl,whitedress
可以看出来脸部、手部、画风都比较一般。
下面我加上对画质的要求(比如:masterpiece、exquisiteface)、风格(比如:photorealistic)的要求、还有镜头距离的要求(比如:closeup)、反向提示词看看效果:
提示词:((masterpiece)),((exquisiteface)),((bestquality)),((photorealistic)),abeautifulyounggirl,whitedress,closeup,Appropriatelighting
反向:NSFW,outofframe,worstquality,lowquality,jpegartifacts,ugly,duplicate,morbid,mutilated,extrafingers,mutatedhands,poorlydrawnhands,poorlydrawnface,mutation,deformed,blurry,dehydrated,badanatomy,badproportions,extralimbs,clonedface,disfigured,grossproportions,malformedlimbs,missingarms,missinglegs,extraarms,extralegs,fusedfingers,toomanyfingers,longneck
生成图片如下:(可以看出来,脸部算比较清晰精致了,然后也理解了真实的摄影风格,然后近景)
ControlNet是斯坦福大学研究人员开发的StableDiffusion的扩展,使创作者能够轻松地控制AI图像和视频中的对象。它将根据边缘检测、草图处理或人体姿势等各种条件来控制图像生成。ControlNet可以概括为一种简单的稳定扩散微调方法。下面我给大家简单介绍一下ControlNet如何使用,下图是ControlNet的webui的页面,我着重讲一下标识出来的4个模块:
常用几个选项:
这里还是基于上面那个SD案例中的白裙小女孩,我们先加上controlnet看看效果吧。后续第三节再细节每个controlnet模型的使用场景哈。
提示词保持不变:((masterpiece)),((exquisiteface)),((bestquality)),((photorealistic)),abeautifulyounggirl,whitedress,closeup,Appropriatelighting
加上ControlNet-candy的效果:
生成图片效果如下:(白裙、精致的脸庞、candy姿势基本都保持了,)
以下原图是自己拍摄的一张图片,后续尽量都会基于这张图片试验controlnet的各种图生图的效果。
Canny通过使用边缘检测器创建高对比度区域的轮廓来检测输入图像。线条可以捕捉到非常详细的信息,但如果你的图像背景中有一些物体,它很可能会检测到不需要的物体。所以背景中物体越少效果越好。
使用场景:希望保留参考图的形状,轮廓会和原图比较接近
提示词:((masterpiece)),((nsanelydetailed)),((HDQuality)),((bestquality))((Illustrationstyle)),thebackofagirl,thebackgroundisthescenerynearOrientalPearlTVTowerinShanghai
我重绘幅度调的0.75,建筑已经比较接近原图了,用图生图的功能时,重绘幅度越大,AI发挥空间越大。一般0.6-0.75左右会比较接近原图。但是人物衣服的颜色也差距较大。
涂鸦的目的是从简单的黑白线条画和草图生成图像。用户也可以使用“Canvas”选项创建特定大小的空白画布,用于手动素描(也可以直接上传图像)。如果草图和绘图由白色背景上的黑线组成,则需要选中“InvertInputColor”复选框。
这个预处理器有助于生成输入图像的深度估计。深度通常用于控制图像内物体的空间定位。浅色区域意味着它离用户更近,而深色区域则离用户更远。
在大图像时它可能会丢失图像内部的细节(面部表情等)。一般会与control_sd15_depth模型组合使用。MidasResolution函数用于增加或减少detectmap中的大小和细节级别。它的级别越高,将使用更多的VRAM,但可以生成更高质量的图像,反之亦然。
说明:保留参考图的空间关系,缺少细节。
包包、衣服的细节变化比较大。
这张图可能效果不太明显,我换一张图,下面是预览效果:(使用depth-midas)
生成效果如下:(可以看出来深度保留的很好,但是有些细节比如中间那个路的细节丢失了)
DepthLeres有与Depth相同的基本概念,但在地图中包含更广泛的范围。但有时它会从图片中捕获了太多信息,可能会生成与原始图像略有不同的图像。
生成对比图如下:(可以看到高楼细节变化还是很大的,但是图片深度的空间定位保留的很好)
这2种差不多,可以根据不同的图试用两种预处理器,然后决定用哪一种更好。
法线图使用了三种主要颜色(红、绿、蓝),通过不同的角度来精确定位物体的粗糙度和光滑程度。它生成法线图的基本估计,可以保留相当多的细节,但可能会产生意想不到的结果,因为法线图完全来自图像,而不是在3D建模软件中构建的。
法线图有利于突出复杂的细节和轮廓,并且在定位对象方面也很有效,特别是在接近度和距离方面。“NormalBackgroundThreshold”用于调整背景成分。设置一个更高的阈值可以移除背景的远处部分(将其混合成紫色)。降低阈值将命令AI保留甚至显示额外的背景元素。
背影图生成效果如下:(变化比较大)
可能这个controlnet用这张图片不合适,我换一个建筑图试一下。
预览效果:(可以看到丢失了一些轮廓)
生成效果如下:(背影居然增加了海滩的部分,然后主楼也变了)
控制生成人物的动态;这个预处理器生成了一个基本的骨骼火柴人形象。这种技术被广泛采用,因为多个OpenPose骨架可以组合成一个图像,这有助于引导稳定扩散生成多个一致的主题。
示例效果:
动作姿态和手部图一控制生成人物的动态和手;
分割预处理器检测并将上传的图像分割为同一图像内的段或区域。该模型在生成一组新的图像时,将detectmap图像应用于文本提示。
用不同色块生成对应的物体,背影图效果如下:
我再用上面的建筑图试一下:
预览效果:
生成图片:(可以看出来色泽是保留的最好的)
最后再看一组玩偶我用controlnet生成的效果:
用于设置是提示词和controlnet那个比重更高,比如你只希望大概参考controlnet的一些形状,希望出现更多你提示词里面的内容,则可以选择mypromptismoreimportant,一般可以选择balance。
提供了调整ControlNet大小和上传图像的纵横比。
比如我生成的图片设置的512*512,但是因为我原图是竖版的图片,所以它会自动将原图拉伸后进行匹配再生成。
示例效果:(不推荐使用)
这种不会改变原图比例,且对自动补全左侧原图没有的部分,推荐使用!