记录一下如何使用 inscode stable diffusion 进行 ai 绘图以及使用感受。
一、背景介绍
目前市面上比较权威,并能用于工作中的 ai 绘画软件其实就两款。一个叫 midjourney(简称 mj),另一个叫 stable diffusion(简称 sd)。mj 需要付费使用,而 sd 开源免费,但是上手难度和学习成本略大,并且非常吃电脑配置(显卡、内存)。
和 mj 相比,sd 最大的优势是开源,这意味着 stable diffusion 的潜力巨大、发展飞快。由于开源免费属性,sd 已经收获了大量活跃用户,开发者社群已经为此提供了大量免费高质量的外接预训练模型(fine-tune)和插件,并且在持续维护更新。在第三方插件和模型的加持下,sd 拥有比 midjourney 更加丰富的个性化功能。
stable diffusion 简介
模型原理
引用一张广为人知的 sd 原理图(源于论文https://arxiv.org/abs/2112.10752),该模型主要可以分为三个部分:
- 变分编码器(vector quantised variational autoencoder,vq-vae)
- 扩散模型(diffusion model, dm),在生成图片中起着最重要的作用
- 条件控制器(conditioning)
详细原理介绍可参考文章 stable diffusion 简介
用一句话总结 sd 的模型原理:图片通过 vae 转换到低维空间,配合 conditioning 的 dm 产生新的变量,再通过 vae 将生成的变量转换为图片。
推荐电脑配置
stable diffusion 对电脑配置有一定的要求,比较推荐的配置如下:
操作系统:sd 更加适配于 windows。建议使用 windows10、windows11。
内存:8gb 以上,建议使用 16gb 或以上的内存。在内存比较小的情况下,可能需要调高虚拟内存,以容纳模型文件。
硬盘:40gb 以上的可用硬盘空间,建议准备 60gb 以上空间,最好是固态硬盘。
显卡:最低需要显存 2gb,建议显存不少于 4gb,推荐 8gb 以上。型号方面,因为需要用到 cuda 加速,所以 n 卡支持良好。a 卡可以用,但速度明显慢于英伟达显卡,当然,如果你的电脑没有显卡也可以用 cpu 花几百倍时间生成。
下面是进行 512x 图片生成时主流显卡速度对比:
stable diffusion webui
目前有一些基于 stable diffusion 封装的 webui 开源项目,可以通过界面交互的方式来使用 stable-diffusion,自身还可以通过插件等方式获得更多能力,极大的降低了使用门槛,以下是几个比较火的 webui 项目:
这些项目,和平常软件安装方法有所不同,不是下载安装即可用的软件,需要准备执行环境、编译源码,针对不同操作系统(操作系统依赖)、不同电脑(硬件依赖)还有做些手工调整,这需要使用者拥有一定的程序开发经验。
二、stable diffusion 模型在线使用地址
inscode 的 stable diffusion 环境主要用于学习和使用 stable diffusion,已经安装了相关软件和组件库,可在线直接启动 stable diffusion webui 进行创作。还可以一键购买算力,训练大模型,极大的降低了 ai 绘图使用门槛。
stable diffusion 模型在线使用地址:https://inscode.csdn.net/@inscode/stable-diffusion
进入之后点击运行并使用,会弹出一个购买算力资源的窗口。由于是试用,不涉及到连续生成多张图片等场合,因此算力足够用了,选择 rtx 3080 即可(0.51元/小时),目前活动免费试用。
操作完成之后,会跳转到 inscode 工作台界面,在算力资源中,已经可以看到刚才选择的机器了。
待它初始化完成,右侧有三个选项,选择 stabel diffusion webui 进入即可。进入界面如下图:
三、stable diffusion webui 界面介绍与参数解析
-
第一部分:界面最上端
stable diffusion ckpt
可以选择模型文件,inscode 上面提供了几个常用模型,如 chilloutmix、guofeng3、cute_animals 可供选择。为 inscode stable diffusion 安装某个自己喜欢的模型可查看这里! -
第二部分,便是 stable diffusion webui 项目的主要功能与设置操作
文生图
:顾名思义是通过文本的描述来生成图片
图生图
:用一张图片生成相似的图片
附加功能
:额外的设置
图片信息
:若图片是由 ai 生成的图片,当上传一张图片后,这里会提示图片的相关 prompt 关键字与模型参数设置
模型合并
:可以合并多个模型,有多个模型的权重来生成图片
训练
:模型训练,可以提供自己的图片进行模型的训练,这样别人就可以使用自己训练的模型进行图片的生成
设置
:ui 界面设置
扩展
:插件扩展,这里可以安装一些开源的插件,例如汉化插件 -
第三部分:是正(负)面提示词输入框,我们需要在此框中输入图片的描述信息,正面提示词是我们希望生成的图片需要的文本,负面提示词是我们不希望生成的图片文本。
-
第四部分:界面左下方,便是模型输入的相关参数:
采样方法
:里面设置了很多采样算法,各有优缺,具体每个算法的效果,可以自行尝试
采样迭代步数
:模型迭代一次的步数
平铺
:生成一张可以平铺的图像
面部修复
:面部修复功能,可以提供面部细节,但是非写实风格的人物开启面部修复可能导致面部崩坏
高清修复
:可以把低分辨率的照片调整到高分辨率
宽度
,高度
:输出图片的尺寸
提示词相关性cfg
:较高的数值将提高生成结果与提示的匹配度
随机种子
:seed 一样的情况下,可以生成比较相似的图片,记住保留你喜欢的种子,以便下次再次生成相似的图像
生成批次
:每次生成图像的组数。一次运行生成图像的数量为生成批次 * 每批数量
每批数量
:同时生成多少个图像 -
第五部分:便是一键生成图片的按键,我们设置完成以上参数的设置后,点击生成按键,便可以自动生成图片了,
生成下面的5个小图标(从左到右依次分别是)
- 复原上次生成图片的提示词(自动记录)
- 清空当前所有提示词
- 打开模型选择界面
- 应用选择的风格模板到当前的提示词
- 存档当前的正(负)面提示词
-
相关的图片会展示在第六部分区域。
四、如何在 inscode 给 stable diffusion 安装模型
常用模型下载网址
目前,模型数量最多的两个网站是 civitai 和 huggingface。
civitai 又称 c 站,有非常多精彩纷呈的模型,有了这些模型,但是该网站在国内是被屏蔽的。登录需要科学上网。
huggingface 则相对朴实无华一些,对模型的审核也会更加严格一些。但是好处在于不需要科学上网,而且网速很快。
此外,ai 图站可以淘到不少 c 站下架了的模型,也是相当不错的。
常用模型及说明
如果你点开上述网站去下载模型,就会发现有各种不同类型的模型。
civitai 上的模型主要分为四类:checkpoint、lora、textual inversion、hypernetwork,分别对应 4 种不同的训练方式。
-
checkpoint:是 sd 能够绘图的基础模型,因此被称为大模型、底模型或者主模型,webui 上就叫它 stable diffusion 模型。安装完 sd 软件后,必须搭配主模型才能使用。不同的主模型,其画风和擅长的领域会有侧重。checkpoint 模型包含生成图像所需的一切,不需要额外的文件。但是它们体积很大,通常为2g-7g。存放在 stable diffusion 安装目录的 models 的 stable-diffusion 目录里。
-
lora:一种轻量化的模型微调训练方法,是在原有大模型的基础上,对该模型进行微调,用于输出固定特征的人或事物。特点是对于特定风格特征的出图效果好,训练速度快,模型文件小,一般 10-200 mb,需要搭配大模型使用。存放在 stable diffusion 安装目录的 models 的 lora 目录里
-
embedding/textual lnversion:一种使用文本提示来训练模型的方法,可以简单理解为一组打包的提示词,用于生成固定特征的人或事物。特点是对于特定风格特征的出图效果好,模型文件非常小,一般几十 k,但是训练速度较慢,需要搭配大模型使用。存放在 stable diffusion 安装目录下的 embeddings 目录里。
-
hypernetwork:目前 hypernetworks 已经不太用,类似 lora,但模型效果不如 lora,一般几十 k,需要搭配大模型使用。存放在 stable diffusion 安装目录的 models 下的 hypernetworks 目录里。
模型推荐:checkpoint > lora > textual inversion > hypernetwork
通常情况 checkpoint 模型搭配 lora 或 textual inversion 模型使用,可以获得更好的出图效果。
补充:还有一类 vae 模型,简单理解它的作用就是提升图像色彩效果,让画面看上去不会那么灰蒙蒙,此外对图像细节进行细微调整。
几个推荐模型
-
dreamshaper
胜任多种风格(写实、原画、2.5d 等),能生成很棒的人像和风景图的 checkpoint 模型。
-
chilloutmix/chikmix
chilloutmix 就是大名鼎鼎的亚洲美女模型。市面上你看到的大量的 ai 美女,基本上都是这个模型生成的。当时最火的图应该下面这个系列。
也正是这个模型,让 ai 绘画彻底出圈。
-
cetus-mix
这是一个二次元的混合模型,融合了很多二次元的模型,实际使用效果还不错。对提示词的要求不高。
-
guofeng 系列
这是一个中国华丽古风风格模型,也可以说是一个古风游戏角色模型,具有 2.5d 的质感。目前最新的版本是 guofeng3.4。
-
blindbox
可生成盲盒风格的 lora 模型,使用时主模型建议选 rev animated。
如何在 inscode 给 stable diffusion 安装 lora
-
首先,在自己的电脑上下载好需要安装的 lora 文件,并通过 jupyter lab 启动 gpu,如下图所示:
-
打开 jupyterlab 界面,找到上传入口,将下载好的 lora 上传到 gpu。
-
打开 terminal ,将已经上传到 gpu 的 lora 文件复制到 /release/stable-diffusion-webui/models/lora 文件夹下。
具体命令:# cd /root/workspace # ls jupyterlab.log shinkai_makoto_offset.safetensors stable-diffusion-webui.log # cp shinkai_makoto_offset.safetensors /release/stable-diffusion-webui/models/lora # cd /release/stable-diffusion-webui/models/lora # ls cute_animals.safetensors suoiresnustyle-rech44.safetensors zhoushuyi.safetensors capi-09.safetensors mix4.safetensors guofeng3.2_lora.safetensors yaemiko_mixed.safetensors czhoushuyi.safetensors koreandolllikeness_v15.safetensors shinkai_makoto_offset.safetensors
-
当看到下载的 lora 模型文件已经存在 lora 文件夹下,重新打开 stable diffusion webui,点击右侧红圈中的 icon,稍等片刻,可以看到 lora 界面被打开
-
点击 lora 之后,可以看到当前 stable diffusion 已经安装的 lora,找到自己上传的 lora,就会在 prompt 产生一行对该 lora 的引用。
至此,当前的 stable diffusion 版本已经装好了某个自己喜欢的 lora,同理 , 可以用同样的操作方式安装 checkpoint、 embedding 等。
接下来我们使用 inscode stable diffusion 来进行 ai 绘图。
五、使用 inscode stable diffusion 进行 ai 绘图
下面是我的一些生成例子的图片展示,附带参数设置以提示词和种子:
生成图一
参数配置:
steps(采样迭代步数): 30
sampler(采样方法): euler a
生成批次:1
批次数量:1
cfg scale: 7
size: 768x1024
model hash: 7234b76e42
model: chilloutmix-ni
version: v1.2.0
seed: 162297642
提示词:
生成图二
参数配置:
steps(采样迭代步数): 30
sampler(采样方法): euler a
生成批次:1
批次数量:1
cfg scale: 7
size: 768x1024
model hash: 74c61c3a52
model: guofeng3
version: v1.2.0
seed: 1110161009
提示词:
生成图三
在图三图四中使用了 makoto shinkai 的 lora 模型,可以生成新海诚画风图片
参数配置:
steps(采样迭代步数): 30
sampler(采样方法): euler a
生成批次:1
批次数量:1
cfg scale: 7
size: 1440x810
model hash: 9c321174ae
model: ghostmix_v11
version: v1.2.0
seed: 2262843784
提示词:
生成图四
参数配置:
steps(采样迭代步数): 30
sampler(采样方法): euler a
生成批次:1
批次数量:1
cfg scale: 7
size: 1440x810
model hash: 9c321174ae
model: ghostmix_v11
version: v1.2.0
seed: 4267252388
提示词:
六、使用体验
本次功能测评到此结束。总得来说,inscode 上面在线运行 stable diffusion 体验非常棒。然而,有时候会卡死,需要重启 gpu。此外,chilloutmix 在负面提示词较少时容易生成涩图。。。不利于青少年学习
感兴趣的小伙伴可以亲自尝试一下!
**题外话**
=========
初入计算机行业的人或者大学计算机相关专业毕业生,很多因缺少实战经验,就业处处碰壁。下面我们来看两组数据:
-
2023届全国高校毕业生预计达到1158万人,就业形势严峻;
-
国家网络安全宣传周公布的数据显示,到2027年我国网络安全人员缺口将达327万。
一方面是每年应届毕业生就业形势严峻,一方面是网络安全人才百万缺口。
6月9日,麦可思研究2023年版就业蓝皮书(包括《2023年中国本科生就业报告》《2023年中国高职生就业报告》)正式发布。
2022届大学毕业生月收入较高的前10个专业
本科计算机类、高职自动化类专业月收入较高。2022届本科计算机类、高职自动化类专业月收入分别为6863元、5339元。其中,本科计算机类专业起薪与2021届基本持平,高职自动化类月收入增长明显,2022届反超铁道运输类专业(5295元)排在第一位。
具体看专业,2022届本科月收入较高的专业是信息安全(7579元)。对比2018届,电子科学与技术、自动化等与人工智能相关的本科专业表现不俗,较五年前起薪涨幅均达到了19%。数据科学与大数据技术虽是近年新增专业但表现亮眼,已跻身2022届本科毕业生毕业半年后月收入较高专业前三。五年前唯一进入本科高薪榜前10的人文社科类专业——法语已退出前10之列。
“没有网络安全就没有国家安全”。当前,网络安全已被提升到国家战略的高度,成为影响国家安全、社会稳定至关重要的因素之一。
网络安全行业特点
1、就业薪资非常高,涨薪快 2021年猎聘网发布网络安全行业就业薪资行业最高人均33.77万!
2、人才缺口大,就业机会多
2019年9月18日《中华人民共和国中央人民政府》官方网站发表:我国网络空间安全人才 需求140万人,而全国各大学校每年培养的人员不到1.5w人。猎聘网《2021年上半年网络安全报告》预测2027年网安人才需求300w,现在从事网络安全行业的从业人员只有10w人。
行业发展空间大,岗位非常多
网络安全行业产业以来,随即新增加了几十个网络安全行业岗位︰网络安全专家、网络安全分析师、安全咨询师、网络安全工程师、安全架构师、安全运维工程师、渗透工程师、信息安全管理员、数据安全工程师、网络安全运营工程师、网络安全应急响应工程师、数据鉴定师、网络安全产品经理、网络安全服务工程师、网络安全培训师、网络安全审计员、威胁情报分析工程师、灾难恢复专业人员、实战攻防专业人员…
职业增值潜力大
网络安全专业具有很强的技术特性,尤其是掌握工作中的核心网络架构、安全技术,在职业发展上具有不可替代的竞争优势。
随着个人能力的不断提升,所从事工作的职业价值也会随着自身经验的丰富以及项目运作的成熟,升值空间一路看涨,这也是为什么受大家欢迎的主要原因。
从某种程度来讲,在网络安全领域,跟医生职业一样,越老越吃香,因为技术愈加成熟,自然工作会受到重视,升职加薪则是水到渠成之事。
黑客&网络安全如何学习
今天只要你给我的文章点赞,我私藏的网安学习资料一样免费共享给你们,来看看有哪些东西。
1.学习路线图
攻击和防守要学的东西也不少,具体要学的东西我都写在了上面的路线图,如果你能学完它们,你去就业和接私活完全没有问题。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己录的网安视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
内容涵盖了网络安全法学习、网络安全运营等保测评、渗透测试基础、漏洞详解、计算机基础知识等,都是网络安全入门必知必会的学习内容。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
csdn大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享
3.技术文档和电子书
技术文档也是我自己整理的,包括我参加大型网安行动、ctf和挖src漏洞的经验和技术要点,电子书也有200多本,由于内容的敏感性,我就不一一展示了。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
csdn大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享
4.工具包、面试题和源码
“工欲善其事必先利其器”我为大家总结出了最受欢迎的几十款款黑客工具。涉及范围主要集中在 信息收集、android黑客工具、自动化工具、网络钓鱼等,感兴趣的同学不容错过。
还有我视频里讲的案例源码和对应的工具包,需要的话也可以拿走。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
csdn大礼包:《黑客&网络安全入门&进阶学习资源包》免费分享
最后就是我这几年整理的网安方面的面试题,如果你是要找网安方面的工作,它们绝对能帮你大忙。
这些题目都是大家在面试深信服、奇安信、腾讯或者其它大厂面试时经常遇到的,如果大家有好的题目或者好的见解欢迎分享。
参考解析:深信服官网、奇安信官网、freebuf、csdn等
内容特点:条理清晰,含图像化表示更加易懂。
内容概要:包括 内网、操作系统、协议、渗透测试、安服、漏洞、注入、xss、csrf、ssrf、文件上传、文件下载、文件包含、xxe、逻辑漏洞、工具、sqlmap、nmap、bp、msf…
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
发表评论