如何使用稳定的扩散进行覆盖
Stable Diffusion 是在线提供的顶级人工智能文本到图像生成工具之一。该软件由 Stability.ai 开发,是一款革命性的图像转换器。它使用潜在扩散模型根据文本提示渲染一些最快的图片。
在其众多功能中,外画是最令人兴奋的功能之一。它有助于根据文本描述、采样方法和分辨率设置向一个或多个方向扩展现有图像。与纯粹的人工智能生成的图像不同,外画功能让艺术家和休闲稳定扩散用户对最终产品有更多的控制权。
使用提示创建图像
在稳定扩散中解决外画问题之前,您必须生成一张图片。以下是如何使用Automatic1111 GUI界面创建新图像。
转到 txt2img 选项卡。
-
在提示文本框中输入描述您的图像的文字。
在否定提示文本框中输入描述您不希望看到的图形元素的文字。
根据显卡的功能,将采样步长设置为 50-55 左右。
使用您想要的任何采样方法并设置图像的宽度和高度。
如果您要在图像中生成人物,请选中“恢复面孔”选项。
-
如果要渲染多张图像,请调整“批量计数”滑块。
将种子设置为“-1”,除非您有想要重新创建的特定图像种子。
单击“生成”按钮。
请注意,您在提示文本框中键入的单词非常重要。如果您想要特定的笔触、样式、颜色和其他效果,则必须在该部分中提及它们。
除非另有说明,否则默认的稳定扩散图像生成器将渲染具有摄影感觉的东西。
在稳定扩散中使用 Outpaint 功能
渲染图像后,您可以开始对其进行扩展或覆盖。从批次中选择您最喜欢的图像,然后单击“发送到 img2img”按钮。
按照以下步骤配置稳定扩散以进行外绘。
-
转到Automatic1111 GUI 界面中的img2img 选项卡。
向下滚动,直到看到“脚本”下拉菜单,然后选择“Outpainting mk2”。
通过选中“左”、“右”、“上”或“下”框来选择绘制方向。
在UI顶部的提示文本框中描述外画的视觉元素。
选中“仅调整大小”选项。
使用滑块将采样步长设置在 80 到 100 之间。
调整像素数,通常可以最大化像素数以获得最高图像质量。
单击“生成”按钮。
配置 Outpaint 流程的最佳方法
在 Stable Diffusion 和其他支持 AI 的文本到图像软件中进行绘制的最大问题之一是 AI 过载。例如,在多个方向上扩展一张图片可能会产生混合结果。
另外,如果只有一侧效果好,则不能保留它并在其他方向重画。相反,你必须从头开始。这意味着您可能无法重新创建看起来完美的一侧。
为了在稳定扩散中获得最佳的外涂效果,您需要执行以下操作。
向左展开
在 img2img 选项卡中加载您的图片。
描述您想要在外画中使用的视觉元素。
如果需要,添加负面提示。
选择“左”绘制方向并取消选中其他三个选项。
单击“生成”,直到您对结果感到满意为止。
- 将图像从右侧 UI 窗格拖动到 img2img 选项卡。
向右展开
在提示字段中描述您想要和不想要的视觉元素。
如果您希望 AI 忽略细节,请添加负面提示。
选择“右”绘制方向并取消选中前一个。
点击“生成”,直到得到很棒的东西。
将图像拖到 img2img 选项卡或点击“发送到 img2img”按钮。
向上扩展
为图像添加新的视觉元素。
如果需要,添加负面提示。
选择“向上”绘制方向并取消选中最后一个。
点击“生成”直到您喜欢结果。
- 将最终图像拖放到 img2img 选项卡中。
向下展开
在生成向下扩展之前输入最终描述。
使用一些负面提示,最好防止与原始图像重叠。
选择“向下”作为绘制方向并取消选中其他所有内容。
单击“生成”按钮,直到对结果满意为止。
一次向一个方向扩展图像的另一大好处是,您可以更好地描述图像。
例如,假设您的起始图像有以下提示:“孩子们在院子里玩耍。”您可以在一侧添加“狗在院子里玩耍”,在另一侧添加“猫在院子里玩耍”。人工智能将有更大的机会把事情做好并在最终图像中渲染逼真的动物。
在同一个示例中,您可以在提示中输入“蓝天和鸟”,让 AI 在原始图像上方向外填充,而不是在各个方向上填充天空的大块。
在稳定扩散中绘制时需要掌握什么
稳定扩散并不便宜。但由于它是开放式人工智能软件,您可以在自己的机器上运行它,以避免每代支付费用。请注意,您可能需要一个具有大约 8 GB VRAM 的像样显卡和一个良好的 CPU,以避免渲染时间超慢。
现在需要安装Automatic1111 GUI Web UI。
如何在 Windows 上安装稳定的 Diffusion Automatic1111 Web UI
根据您的 CPU 下载并安装适当的 32 位或 64 位 Git 独立安装程序。
运行“git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git”以获取正确的存储库。
从此处下载标记为“model.ckpt”的稳定扩散模型检查点。
在“models”目录中添加“model.ckpt”。
双击“webui-user.bat”可执行文件。
- 生成图片并尝试修复、修复和其他功能。
如何在 Linux 上安装稳定的 Diffusion Automatic1111 Web UI
在 Linux 计算机上安装 Automatic1111 Web UI 略有不同,但非常简单。以下是您必须遵循的步骤。
红帽Linux
在终端中输入“
sudo dnf install wget git python3
”。通过运行“
bash <(wget –q0-https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)
”来安装 UI。
Debian Linux
输入“
sudo apt install wget git python3 python3-venv
”并在终端中运行它。使用以下命令安装 UI:“
bash <(wget –q0-https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)
。”
Arch Linux
在终端中输入“
sudo P –S wget git python3
”。在终端中运行“
bash <(wget –q0- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)
”。
如何在 Apple Silicon 上安装稳定的 Diffusion Automatic1111 Web UI
在Apple Silicon 计算机上安装Automatic1111 Web UI 的命令与其他操作系统不同。
启动终端应用程序。
执行“
$cd ~/Documents/
”运行“
$curl https://raw.githubusercontent.com/dylancl/stable-diffusion-webui-mps/master/setup_mac.sh -0 setup_mac.sh
”执行“
$chmod +x setup_mac.sh
”运行“
./setup_mac.sh
”- 按照终端界面中显示的后续说明进行操作。
您可以通过在终端中运行“./run webui_mac.sh
”来运行Automatic1111 UI。每当您运行它时,它都会以对存储库进行的最新更新开始。
绘制图像后该怎么办
尽管稳定扩散人工智能非常出色,但它还远非完美。过多的信息和冗长的描述可能会导致一些不太令人兴奋的图片。同样,模糊的描述可以扩展图像,而无需添加足够的相关视觉元素。
完成外涂后,您有两种选择。您可以保存图像并在您喜欢的图像编辑器中进一步编辑。但更多地利用稳定扩散的另一种方法是改用修复。
在右侧窗格中选择您的图像,然后单击“发送到 Inpaint”按钮。用户界面将切换到新型编辑功能。这是填充图像某些部分空白的好方法。
选择画笔大小并遮盖图像中要添加内容的部分。
描述修复元素。
取消选择“Outpainting mk2”脚本。
单击“生成”,直到对结果满意为止。
急需的功能终于来了
尽管 Stable Diffusion 于 2022 年 8 月推出,但绘制功能最初并不真正存在。至少它最早的迭代并不引人注目。但在很短的时间内,稳定扩散的修复功能就超越了修复功能。
该软件可以生成令人惊叹的图像。凭借 75 个单词的描述性文本和一个单独的负面提示字段,人工智能的准确性令人震惊。
现在我们想听听您的意见。到目前为止,您对稳定扩散或类似软件的体验如何?您通常能否渲染出令人满意的图像,或者是否需要花费太多时间?请在下面的评论部分告诉我们您的稳定扩散经验和外涂技巧。