网站搜索

如何写一个很棒的稳定扩散提示


Stable Diffusion 是一种流行的 AI 艺术生成器,需要文本提示才能制作图像。有时它会做得非常出色,并通过模糊的提示准确生成您想要的内容。其他时候,你会得到次优的输出。这里有一些获得理想结果的提示和技巧。

如何编写稳定的扩散提示

如果您花时间使用过 AI 图像生成器,例如 Stable Diffusion、DALL-E 或 MidJourney,您会注意到措辞良好的提示很重要。一个措辞良好的提示是将你的想法变成一个伟大的形象和用太多的手指盯着你看的恐怖谷怪物之间的区别。

自 Stable Diffusion 于 2022 年 8 月推出以来,人们一直在努力找出获得理想结果的最佳方法,并且他们将在未来几年内“快速锻造”或“快速工程”。这是特别有可能的,因为通知稳定扩散如何生成图像的检查点将接收定期更新。在可预见的未来,理想的提示将成为一个移动的目标。

尽可能具体

Stable Diffusion 倾向于在特定提示下茁壮成长,尤其是与 MidJourney 之类的东西相比时。您需要准确地告诉它您想要什么。下面是一个使用互联网上最受欢迎的动物的例子:可爱的猫。

好吧,他们很可爱,除了中间那个可怜的家伙,他看起来好像花了太多时间凝视深渊。但是,如果您想要灰猫而不是混合猫怎么办?好吧,你需要指定它。请改用“可爱的猫”作为提示。

现在稳定扩散返回所有灰猫。您可以继续添加您想要的东西的描述,包括为图片中的猫装饰。

这适用于任何你想要稳定扩散产生的东西,包括风景。具有描述性,并且当您尝试不同的关键字组合时,请记住图像如何变化。一些单词和短语往往比其他单词更强烈地偏向图像,因此您可能需要相应地调整提示。

命名特定的艺术风格或媒介

当您完整描述所需图像的内容时,对特异性的需求并没有结束。您还可以(并且应该)指定您想要的样式。为此,我们将坚持使用“可爱的灰猫”提示。假设我们想要一些可爱的灰猫,但我们也希望它们看起来像一幅丙烯画。你应该尝试的第一件事是在你的提示中添加“acrylic painting”作为下一个关键字,这样它就会显示:“Cute Gray Cat,acrylic painting”。

通常最好从最少的关键字开始,以接近您想要的内容,然后根据您正在寻找的美学添加更多关键字。

稳定扩散可识别数十种不同的风格,从铅笔画到粘土模型再到 Unreal Engine 的 3D 渲染。

这些示例提示非常简单,但您可以使用数十个关键字来微调结果。如果您想在沃尔玛购买怪异的、迷幻色的粘土鸡模型,则需要指定所有这些条款。

命名特定艺术家以指导稳定传播

Stable Diffusion 不仅仅可以模拟特定的风格或媒介;如果您想这样做,它甚至可以模仿特定的艺术家。这个例子使用了 Pablo Picasso。

如果你还没有,你绝对应该尝试将“by(艺术家姓名)”放入你的提示中。它往往会产生戏剧性的结果。不要害怕将通常不会在一起的艺术家结合起来。通常,Stable Diffusion 会以激动人心且不可预测的方式结合他们各自的风格。

权衡你的关键词

当然,仅仅将关键字塞入您的提示中只会让您走到这一步。如果您在提示中得到所有正确的东西,但它们的比例不正确,会发生什么?

Stable Diffusion 支持对提示关键词进行加权。换句话说,你可以告诉它它确实需要关注一个特定的关键词(或多个关键词)而不太关注其他关键词。如果您得到的结果有点像您正在寻找的,但又不完全是这样,那么它会很方便。

在 Stable Diffusion 的命令行版本中,您只需在要强调的单词上添加一个完整的冒号,后跟一个十进制数字。小数是百分比,因此它们加起来必须为 1。

回到我们的“可爱的灰猫”提示,让我们想象它正确地生成了可爱的猫,但输出的图像中并没有很多以灰猫为特色。您可以将提示修改为:“cute, gray cat:0.7”,它会最关注灰猫,然后自动将差异应用到“cute”。如果你想要更好的控制,你也可以手动为提示中的每个单词分配权重,例如“可爱:0.10,灰猫:0.60,虚幻引擎渲染:0.30”。

大多数可用于 Stable Diffusion 的 GUI 都可以处理权重,而无需您输入明确的百分比。您通常可以在提示中的术语周围添加括号以强调它,并在方括号中添加括号以降低术语的重要性。所以之前的“cute, grey cat”可能看起来像“[cute],((grey cat))”。

从别处寻找灵感

Stable Diffusion 和其他 AI 艺术生成器经历了爆炸性的人气飙升。你到处都能找到这种人工智能艺术。这意味着现在至少有几百万张用户生成的图像在互联网上流传,而且大多数时候,人们会附上他们用来获取结果的提示。

如果您不确定要创建什么,这里有一些资源可以帮助您激发灵感:

  • Lexica — 使用 Stable Diffusion 和相应提示生成的图像存储库。可按关键字搜索。
  • Stable Diffusion 艺术家风格研究 - Stable Diffusion 可能认可的艺术家的非详尽列表,以及对他们艺术风格的一般描述。有一个排名系统来描述 Stable Diffusion 对作为提示一部分的艺术家姓名的响应程度。
  • Stable Diffusion Modifier Studies — 可与 Stable Diffusion 一起使用的修饰符列表,就像艺术家页面一样。
  • AI 艺术修改器列表 — 一个照片库,展示了您可以在提示中使用的一些最强大的修改器,以及它们的作用。它们按修饰符类型排序。
  • 代表 Stable Diffusion 的前 500 位艺术家——我们确切地知道 Stable Diffusion 训练集中包含哪些图像,因此可以判断哪些艺术家对训练 AI 的贡献最大。一般来说,艺术家在训练数据中的代表性越强,Stable Diffusion 对他们的名字作为关键字的响应就越好。
  • The Stable Diffusion Subreddit — The Stable Diffusion subreddit 有源源不断的新提示和有趣的发现。如果您正在寻找灵感或见解,就不会出错。

调整其他重要设置

一个好的提示是使用 Stable Diffusion 最难的部分,但还有一些其他设置会显着改变结果。

  • CFG:确定 Stable Diffusion 遵循您的提示的强度。较高的数字会导致更多地遵守提示,而较低的数字会为 AI 提供更多的自由。先尝试调整一下。
  • 采样方法:如何将图像从噪声中提炼成可识别的形状。尝试其中的一些。 Euler_a、k_LMS 和 PLMS 似乎是受欢迎的选择。
  • 采样步数:在您获得最终结果之前对图像进行采样的次数。有时您在 30 步时会得到很好的结果,有时您需要达到 50 或 80 步。您通常不会在 150 步以上获得更好的结果。从更少的步骤开始,然后再往上走。

我们最喜欢的一些程式化提示

这些是我们最喜欢的一些提示,因为它们往往工作起来非常可靠。只需放入您选择的主题和一些修饰语即可。所有其他稳定扩散设置都与上面的提示保持相同。

(主题),35mm,锐利

选择一个主题,此提示会可靠地返回人物、动物和风景的逼真结果。

(主题),低多边形 3d 渲染,充满活力的柔和色彩,移轴,胶片颗粒

输入一个主题,您将在“拉力赛的艺术”美学中获得它。

(主题), (环境描述), 电影式, 戏剧性, 构图, 晴空, 野兽派, 超现实主义, 史诗级规模, 敬畏感, 超级极简主义者, 疯狂的细节水平, artstation HQ

只需输入主题和环境描述,此提示就会提供出色的城市概念艺术图像以及您选择的环境效果。下面是一个以纽约市为主题,以沙尘暴为环境描述的例子:

任何东西

稳定扩散与 Kermit 一起产生了很好的效果。随时随地试用。

为什么 Stable Diffusion 会这样解释“魔多的柯米特”,站在我们坚定的英雄背后的红色邪恶柯米特是谁?不知道。

请记住,不要害怕从提示中删除您认为可能是关键术语的内容。某些词,如“华丽”,会严重影响图像的外观,即使它没有确切的含义。当您花更多时间使用 Stable Diffusion 时,您会逐渐了解它对某些词的反应,您很快就会发现写出好的提示本身就是一门艺术。