超简单!教你零基础入门AI绘画神器StableDiffusion优设网

在开始学之前,我想提前说一下,我所理解的AI绘画的本质,就是手替,人提出方案,AI帮你完成具体的作画过程。

受限于篇幅,这篇只介绍最基本的操作,并且会带手把手带大家去做一个案例出来,让大家先把AI绘图的整个流程跑通。如果反馈还不错的话,下一篇补充一些进阶的操作。

AI工具大对比:

先给大家看一下我用StableDiffusion(以下称SD)画出来的图,可以看到画面很细腻且用色也非常精致。

1.AI绘画工具的选择

目前市面上最流行的两个绘图工具Midjourney和StableDiffusion以及他们之间的区别,具体的研发背景等信息这里不做赘述,大家可以自行百度,只说一下对于设计师更关心的五个方面。

综上,从我的个人角度出发,SD在工作中落地的潜力是要大于MJ的,这也是我选择学习和深入研究SD的原因。

2.软件安装与打开

这里建议直接安装大佬的一键整合包,极大地降低了安装难度,对小白非常友好。

这里演示一下Win下如何安装,Mac系统的同学也可以在网上找到对应的一键整合包,以及显卡不太好的同学也可以选择云端部署,这里给大家把链接贴出来。大家可以自行对照视频一步一步进行,基本没有什么难度。

①下载后是这两个文件,先双击运行一下右边的程序,安装一些必要的运行环境,然后解压左侧的压缩文件到你想要安装的位置。

②然后打开解压后的文件夹,找到“A启动器”的exe文件,双击打开。

③打开后如图所示。

④然后点击“一键启动”,稍等片刻后会自动打开这个浏览器界面,就可以使用了(第一次打开时会有点久)

3.流程和界面介绍

这里不去介绍sd的实现模型,只介绍一下我们所看到的呈现模型。可以理解为,就像是在做一道菜一样。首先准备原料(提示词和参数),然后按照菜谱(模型)来烹饪,让原料经历各种处理,最后就得到了可供品尝的美食(图像)。

下面是关于软件的界面整体布局介绍,主要是由三大模块构成的,模型,提示词和参数,后面的章节会具体介绍一下每个模块。

1.模型分类:SD五大模型

如前面所说,模型就像是我们做菜时所用到的菜谱。每个模型都会有自己的风格,例如二次元画风,CG画风等。

在SD中,目前共有5种模型。

对于这几种的区别和使用方式,可以理解为基础底模型就是烹饪中的“炒”,而辅助模型则是“爆炒,小炒”,最后美化模型则是更细节的方式,例如(盐爆,葱爆,油爆)等。

在sd中,基础底模型必须有且只能有一种,而后面的模型则没有限制性,可以没有,也可以是一种或多种。

2.模型的下载和使用

我们在下模型时,就可以看到对应的类别:这里以最常用的基础底模型(checkpoint)和lora模型为例,介绍一下它们怎么使用。

③接下来就是模型的调用,对于基础底模型,我们可以直接在这里选择,如果没有找到,点一下右边的刷新按钮,稍等即可。VAE模型则是在后面的下拉框中选择。这里可以一般采用默认的选项,然后如果出来的图发灰,再考虑使用Vae模型。对于其他模型,则需要先点一下这里的icon,然后点一下想用的模型即可,这时上面的正向提示词输入框会出现对应的模型,想取消调用的话,再点一下模型或者直接在输入框中删掉即可。对于某一些模型,还需要在正向提示词输入框中输入特定的触发词,才可以让模型发挥效果。

提示词也就是我们对AI的指令。

1.基本规范

这里有两条基本规范需要注意一下:

2.书写提示词的整体思路

在给正向提示词的时候,我们一般通过分类描述的方式来给出。具体可以分为以下三类:整体描述、主体、场景。

①整体描述

这里包括四个方面:

画质:高画质还是中等画质或者低画质,2k、或者4k等等

画风:CG、二次元、真人等

镜头:画面中人物的占比,半身像还是全身像

色调:冷色调或暖色调

②主体

对于人物主体的描述包括三个方面:头部、服饰、姿势

③头部

这里面包括的内容和我们玩游戏时捏脸的内容差不多,具体也就是包括这些内容:

④服饰

包括衣服,裤子、鞋以及其他更细节的比如袜子之类的

⑤姿势

即人物的姿势,坐立跑等

⑥场景

3.提示词的语法

仅仅有了提示词还不够,我们还需要知道怎么把提示词组成SD可以识别的格式。

①提示词的连接方式

②提示词的强化/弱化方式

③提示词的进阶玩法

这里推荐几个提示词的网站。在掌握了提示词的基本用法后,再去看这些网站就会更得心应手一些。

这里不想去说太多参数的官方解释,而且,在初期并不是所有的参数都需要了解,所以这里直接用通俗易懂的语言来给大家介绍一下需要用到的参数是什么,以及怎么用。

1.采样方法

这里的原理比较复杂,笔者这里直接抛出结论:

一般情况下使用DPM++2M或DPM++2MKarras或UniPC,想要一些变化,就用Eulera、DPM++SDE、DPM++SDEKarras、DPM2aKarras。

2.迭代步数

这里是相同提示词和参数,不同迭代步数时的表现。可以看到在这组参数下,步数在32左右表现是最好的,从32到40提升不大,到48时以及出现了一些畸形,到64时腿部已经完全畸形了。

3.面部修复

根据个人喜好开关,这个对最终成像效果影响不大。

4.平铺图

这个一般用不到。

5.高分辨率修复

通俗来说,就是以重新绘制的方式对图像进行放大,并且在放大的同时补充一些细节。

打开后,这里会出现一些子参数。

放大算法:用默认值即可。

高分迭代步数:一般选在10~20即可。这里还是以这个图为例,可以看到在步数超过20后就开始出现了畸形。

重绘幅度:一般是0.5~0.8之间。幅度过小,效果不好,幅度过大时,和原图差异太大。

放大倍率:这个比较好理解,就是指最终的图原来图的分辨率的比值。例如,默认生成的图是512_512,设定为2倍后,最终产出的图就是1024_1024。

6.总批次数和单批数量

这个是指一次性出图的数量。以搬砖为例,同样是搬4块砖,体力好的人可以一次搬4块,只搬一次,对应到SD中,就是总批次数是1,单批数量为4;而体力不好的人一次只能搬一块,需要搬4次,对应到SD中,就是总批次数是4,单批数量为1。一般而言,如果不是顶级显卡,我们都会保持单批数量为1,去改变总批次数来增加一次性出图的数量。

7.提示词引导系数

最终生成的画面和你的描述词的趋近程度,一般设置为7~15之间,太高也会出现问题。

8.随机数种子

随机数种子就像在做一道菜时加入的特定调料,它可以影响整道菜的味道。在这个图像生成方法中,随机数种子就是一个特定的数值或代码,可以影响最终生成的图像的过程,就像特定的调料会影响整道菜的味道一样。不同的随机数种子会生成不同的图像,就像加入不同的调料会让同一道菜变成不同的味道。每个图都会有它对应的随机数种子,如果想还原这张图,或者绘制一张相似的图,必须保证这个值是相同的。随机数种子不变的情况下,即使模型发生了改变,最终生成图的大概结构和配色也会有一定相似性。就像是无论是以土豆还是以茄子作为食材,只要加入的都是甜辣酱,最终的味道是差不多的。我们可以在输入框中输入特定的值,以保证随机数种子固定,否则可以点一下旁边的骰子icon,变成-1(-1就指的是随机值)使得模型采用随机的值来生成图像。

9.变异随机种子

在理解了随机种子之后,我们再去理解变异随机种子就更好理解了。变异随机种子相当于又加入了第二种特定调料。而后面的变异强度就指的是两种调料的占比,数值越大,越接近第二种。数值为0时,就指的是完全不用变异随机种子。一般是用于确定了图后,对图生成其他相似画面的图像。例如,在做ip时,通过加入变异随机种子,可以实现画面内容不变的情况下,生成带有些许差异的画,从中选择更优的。

我们来总结一下上面提到的重要参数。

这里以做这样一个盲盒IP为例,演示一下基础的文生图的流程,在了解了基础的概念后,其他的操作就相对简单了,大家可以自行去探索。

这里先说一下做这个图的整理思路。

1.模型下载与安装

从右边模型信息,我们可以知道两个重要的信息,这个模型的种类是LORA模型,以及它的触发词是fullbody,chibi。这里补充一下,所谓触发词指的就是,只有在将触发词加入到正向提示语的输入框中,才能触发这个Lora模型的效果。前面我们讲过,LORA模型是一种辅助模型,需要配合基础底模型来使用。这里我们一般也推荐使用作者示例图中所使用的基础底模型。点开一个示例图,这里就是示例图的信息,包括基础底模型,提示语,以及参数。

我们将两个模型下载好后,分别放到对应的文件夹中。

基础底模型(checkpoint)的文件夹是“novelai-wvebui一键包/novelai-webui-aki-v4/models/Stable-diffusion”,lora模型的文件夹是“novelai-wvebui一键包/novelai-webui-aki-v4/models/lora”

这里有两个小技巧:

接下来,打开webui界面,点击模型后的刷新按钮。并将左上角的第一个下拉框选择到对应的模型。其中,Lora模型是默认隐藏的,需要点一下生成按钮下的第三个icon才会显示。

到这里,我们完成了模型的下载和基础底模型的调用。

2.提示词的书写

对于新手,建议先从模仿开始,这里还是打开C站盲盒模型的页面,然后点击示例图,可以看到包括提示词在内的各种信息。

然后,我们把提示词复制下来,对于英文不好的小伙伴可以直接复制到翻译工具中。

接下来,我们对这段关键词做一个简单的分析拆解:

整体描述:(杰作),(最好的质量),(超细节),(全身:1.2),(美丽的细节脸),(美丽的细节眼睛),

触发词:chibi

人物&场景:一个女孩,可爱,微笑,张开嘴,花,户外,弹吉他,音乐,贝雷帽,拿着吉他,夹克,腮红,树,衬衫,短发,樱花,绿色头饰,模糊,棕色头发,腮红贴纸,长袖,刘海,耳机,黑色头发,粉红色的花

我们可以直接复用整体描述的部分,将这部分复制到正向提示词输入框中。然后对后面的人物和场景部分重写。

将英文复制到正向提示词中,接下来,我们点击一下盲盒的Lora模型,正向提示词部分就多了一句,这句话就表示对lora模型的调用。

最后一步,将示例图的负向提示词也复制到我们的SD中,就得到了如图所示的最终的提示词。

3.参数设置

参数设置这里,采样方式、采样迭代步数和提示词引导系数三个参数建议设置成和Lora模型示例图一致的参数,这样能比较好地发挥Lora模型的效果。然后,作为我们前期探索风格的阶段,总批次数和单批数量可以设置成9和1,随机种子设置成-1,这样一次性会产出9张不同的图,方便我们选择。高分辨率修复在前期不建议打开,可以在图的内容确定后再打开,进行细节优化。

设置好参数后,点击生成。这里由于是随机的,所以生成的图像会和我这里不一样,但是整体的画面都是很相似的。

可以看到,整体图片的风格已经比较满意了,除了手的部分还有些问题。接下来,就可以选择一张最满意的,去补充和修复细节了,这里就以第6张图为例,大家可以选一张自己喜欢的。

我们接下来要做的是这三件事:

首先是第一步固定画面,前面我们讲过,每个图都会有它对应的随机种子,如果想还原这张图,或者绘制一张相似的图,必须保证这个值是相同的。所以,我们需要把找到这张图的seed值,填入参数栏中的随机数种子输入框中。

最后一步,我们去修复手的问题,这里我们采用补充反向提示词的方式来完成。这里依然用有道翻译:

将英文翻译填入反向提示词中后,我们点击生成,就可以得到这么一张效果还算不错的图了。

这只是一个简单的例子,里面用到的提示词并不多,我们可以继续加入提示词来丰富画面,提升细节,例如加入光效描述到正向提示词中。

生成的图像如下,可以看到又增加了一些光感,整体细节和品质又提升了一些。这里仅仅以此为范例,大家可以去增加自己想要的各种提示词来生成自己想要的图。

THE END
1.设计学类包括哪些专业什么专业好设计学类专业包括艺术设计学、视觉传达设计、环境设计、产品设计、服装与服饰设计、公共艺术、工艺美术、数字媒体艺术、艺术与科技。 设计学类专业介绍 一、艺术设计学专业 业务培养目标:本专业培养具备艺术设计与创作、教学和研究等方面的知识和能力,能在艺术设计教育、研究、设计、生产和管理单位从事艺术设计、研究、教https://www.55xw.net/show-34209.html
2.什么是设计?设计都干啥呢设计就是一系列的规则。 一系列的规则是分层次的,由架构到代码。 上层的设计要为下层的设计提供抉择的原则。 每一层都可以制定自己的规则。 这个规则是越来越细的。 设计就是一系列的选择。 选择总有利弊。 选大的利,每一层的规则都应该为大利的选择,做设计,做规则,平衡小利的矛盾(也就是说为下一层的抉择https://blog.csdn.net/xie__jin__cheng/article/details/144019315
3.设计师需要知道的设计原则!费茨定律是设计方法中常用的一种定律之一,不光是产品设计,在日常生活中也有不少应用。这篇文章,作者从定律本身到案例,为我们详细分享了定律的使用和经验,供大家参考。 设计师在体验过形形色色的产品后,是否这样问过自己: 为什么按钮越大、越容易点击? http://app.myzaker.com/news/article.php?m=1732675193&pk=674683e88e9f0967f551899a
4.对比图像分类五大方法:KNNSVMBPNNCNN和迁移学习本文是对五种用于图像分类的方法(KNN、SVM、BP 神经网络、CNN 和迁移学习)进行的实验比较。 图像分类是人工智能领域的基本研究主题之一,研究者也已经开发了大量用于图像分类的算法。近日,Shiyu Mou 在 Medium 上发表了一篇文章,对五种用于图像分类的方法(KNN、SVM、BP 神经网络、CNN 和迁移学习)进行了实验比较,该https://www.51cto.com/article/540092.html
5.组织结构体系设计要点专家观点慧森咨询3.集团组织结构设计的五大板块 集团在重新定位时,需要将若干功能规划好并予以体现,从结构设计角度而言,过程性的结构包含五大板块:资本运营板块、经营协调板块、战略管理板块、资源管理板块和监控管理板块。如图8所示。 根据各板块功能的需要再进行相关的部门资源配制,为每一个板块规划相应的职能、制度输出、人才输出以及价http://www.huisenchina.com.cn/opinion/66.html
6.土木(技术类)岗位简历的撰写要点土木工程的五大分类 土木专业毕业的学生以后可以从事房屋建筑、地下建筑、隧道、道路、桥梁、园林、城建、水利水电工程等的设计、研究、施工、教育、管理、投资、开发部门从事技术或管理工作。 简单来说,土木这个行业可以分为岩土、测绘、建筑、结构、路桥这五大岗位。 https://cv.qiaobutang.com/knowledge/articles/521432f10cf2d5c39d3e42a4
7.强化文化自觉,提升服务竞争力1、客户投诉抱怨的定义、分类 2、客户投诉的五大原因? 3、顾客投诉的五大通道? 4、如何让员工“欢迎投诉” 5、如何让投诉更顺畅方便?欢迎抱怨的六大利好 6、忠诚补救十大原则 7、“化怨为机”十大艺术 第十一单元强化职业化修炼提升服务资质 ---修炼服务利益,提升服务形象 1、http://www.hztbc.com/lesson/info_2374.html
8.职业装设计要注意什么职业装设计审定五大原则→MAIGOO知识摘要:职业装的设计除了遵从基本的服装设计原则之外,基于其本身的功能特性,还应具有相对稳定、行业统一、行业特点、国际统一、审批认可五大原则。 职业装设计要注意什么 职业装设计审定五大原则 职业装在设计阶段,首先要根据人机效果(见服装设计),对各种职业的性质、特点、上下肢活动幅度、人体保护的要求进行调查研究,分析https://m.maigoo.com/goomai/62328.html
9.时序分析五边形战士!清华提出TimesNet:预测填补分类检测通过将1D时间序列转化至2D空间的设计,TimesNet实现了「多个周期分别提取二维时序变化,再进行自适应融合」的时序变化建模过程。 4 实验 我们在长时预测、短时预测、缺失值填补、异常检测、分类五大任务上进行了实验,涵盖36个数据集、81种不同的实验设置。 https://cloud.tencent.com/developer/article/2223948
10.木偶剧《垃圾大战》为什么能获全国展演五大奖项新闻频道近日,在扬州举行的 “广陵杯”全国木偶皮影优秀剧(节)目展演闭幕式上,广东省木偶艺术剧院原创大型环保题材木偶剧《垃圾大战》斩获最佳剧目奖、偶型设计制作奖、导演奖、灯光设计奖、优秀操纵表演奖五大奖项,获奖项目数、获奖人数皆位居全国参展院团前列。国际木偶联会亚太中心主席唐大玉评论道:“《垃圾大战》首演五年https://news.cctv.com/2019/08/18/ARTIHIQrJF26n1K6fxpicmPU190818.shtml
11.图案设计的分类有哪几种平面设计教育宝平面设计学习频道提供图案设计的分类有哪几种信息,不论是为了实用还是审美,在设计中既要考虑图案本身的美感,同时还必须适合各种材质和加工工艺要求。https://hudong.jiaoyubao.cn/xxjy/578895.html
12.娄底市“十四五”新型城镇化发展规划娄底市人民政府高举中国特色社会主义伟大旗帜,贯彻落实党的十九大、十九届二中、三中、四中、五中全会和习近平总书记系列重要讲话精神,认真贯彻“三高四新五大任务”的重要指示,紧紧围绕娄底市建成“先进制造业强市、产教融合城市、综合交通枢纽城市、文明幸福城市”的目标,坚持以人的城镇化为核心,以产城融合为动力,以极轴联动、互促互https://www.hnloudi.gov.cn/loudi/xxgk/sxxgk/xxgk_zfxxgkml/03/fzgh/202201/5abc5419cd0f467991f3f6fca6542de7.shtml
13.架构与设计随笔分类圣殿骑士面向对象知识总结(三大特征,五大原则) 23种设计模式分类总结,Demo实现各种模式 模式总结和实践指导 案例分析 WPF方面的书籍 对于WPF,我花的时间和精力最多,之前有写《WPF 基础到企业应用系列》,本想从WPF的起源、背景、历史、现状讲起,然后逐渐过渡到基础、企业应用以及经验总结等,但写到第九篇就转到了Unix&PowerBuhttps://www.cnblogs.com/KnightsWarrior/category/173142.html
14.分类评价:摆脱同质化,促进高校特色化发展—中国教育在线上海在设计高校分类评价 指标时主要采用了第一种方法,即先把高等教育的 本质属性具体化为高等教育五大职能,先后召开市 教卫党委、市教委处室负责人、不同类型高校专家代 表相关会议各二十余次,请他们列出与高等教育职 能相关、体现不同类型高校特征的指标,并经过多轮 次的意见征集、汇总和分析,把一些非本质、非https://cdce.eol.cn/1031/354156.html