Stable Diffusion【ControlNet】：ControlNet的IP-Adapter预处理器：SD垫图实现_aigc

大家好，今天我们来详细介绍一下controlnet的预处理器ip-adapter。简单来说它就是一个垫图的功能，我们在controlnet插件上传一张图片，然后经过这个预处理器，我们的图片就会在这张上传的图片的基础上进行生成。该预处理器提供的垫图功能，让sd的实用性再上一个新的台阶，在很多方面将彻底改变sd的使用流程。

一.ip-adapter是什么

ip-adapter，它的全称是 text compatible image prompt adapter for text-to-image diffusion models，翻译成中文就是：用于文本到图像扩散模型的文本兼容图像提示适配器，名字有些长，读起来也很拗口。不过我们可以简单的理解就是图片提示或者垫图。

ip-adapter是腾讯研究院出品的一个新的controlnet模型，旨在使预训练的文本到图像扩散模型能够生成具有图像提示的图像。使用stable diffusion的同学深知提示词的重要性，无论是文生图还是图生图，我们都需要撰写相应的提示词以展现特定元素。为了避免生成不符合期望的内容，我们还需编写反向提示词。提示词可以说是图片的灵魂。

然而，stable diffusion 本身支持的提示词都是文本提示词，仅使用文本提示生成所需的图像是非常棘手的，因为它通常涉及复杂的提示工程。文字提示的另一种选择是图片提示，俗话说:“一张图片胜过千言万语”。

ip-adapter是一种有效的轻量级适配器，用于实现预训练文本到图像扩散模型的图像提示能力。ip-adapter的关键设计是分离文本特征和图像特征的交叉注意层的解耦交叉注意机制。仅具有 22m 参数的 ip-adapter 就可以达到与微调图像提示模型相当甚至更好的性能。

ip-adapter由两部分组成:图像编码器从图像提示中提取图像特征，以及具有解耦交叉注意机制的自适应模块将图像特征嵌入到预训练的文本到图像扩散模型中。

如果想深入研究ip-adapter可以参照以下文档。

二. ip-adapter的安装

controlnet中的ip adapter控制模型相对较新，需要把controlnet的模型更新到1.1.400以上的版本才可以。升级完成后在预处理器里找到ip-adapter的选项了。

不过预处理器里没有模型也会报错的。

您需要下载这2个预处理器模型放到/extensions/sd-webui-controlnet/annotator/downloads/clip_vision/目录下面即可。

控制模型的下载

其中，models文件夹下面是适用于sd1.5模型的，下面红框中的2个是目前我们使用最多的。

sdxl_models文件夹下面是适用于sdxl模型的。

下载完成后放到/extensions/sd-webui-controlnet/models/目录下面即可。

三. ip-adapter的使用（官网）

在ip-adapter官网有很多使用效果实例，我们先直观的看一下，以便对ip-adapter的应用有一个直观的了解和感受。

（1）一张图片在不同大模型下的不同效果。

（2）图生图

（3）局部重绘

（4）图像提示+文本提示

（5） ip_adapter与t2i-adapter结合使用

（6）sdxl1.0

ip-adapter不仅在图像质量方面优于其他方法，而且生成的图像与参考图像能更好地对齐。

四. ip-adapter的初体验

下面我们使用一个最简单的实例来体验一下ip-adapter的具体使用。

这里我们不使用任何正向提示词和反向提示词。

文生图相关参数设置

采样器：dpm++2m karras
采样迭代步数：30
图片宽高：保持和上传图片的宽高一致即可

controlnet参数设置如下：

写在最后

aigc技术的未来发展前景广阔，随着人工智能技术的不断发展，aigc技术也将不断提高。未来，aigc技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，aigc技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，aigc技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

感兴趣的小伙伴，赠送全套aigc学习资料和安装工具，包含ai绘画、ai人工智能等前沿科技教程，模型插件，具体看下方。