如何保护您的图像免受 AI 艺术生成器的侵害

摘要：您可以尝试一些方法来保护您的艺术作品免受 AI 生成器的影响：

使用 HaveIBeenTrained.com 等工具选择退出训练数据集。

使用“robots.txt”文件来抵御网络爬虫，其中许多网络爬虫首先用于创建数据集。

版权您的艺术作品并在法庭上挑战这些工具的开发者（或加入现有的集体诉讼）。

仅上传带有大量水印的图片。

首先要避免将您的艺术作品放到互联网上。

AI 艺术生成器可能无法模仿人类的创造力，但它们肯定会敲诈你。这对艺术家和那些害怕 AI 接管的人来说都是一个担忧，但可能不会失去一切。

如何保护受版权保护的艺术免受 AI 侵害

如果没有训练它们的数据集，AI 艺术生成器就什么都不是。这涉及从现有艺术品中提取大量样本，并以一种允许人类使用自然语言提示来创作类似艺术品的方式对其进行语境化。您可以使用 OpenAI 的 DALL-E 2 或 Midjourney 等生成艺术应用程序亲自尝试。

我们要求 DALL-E 2 制作“一张来自芝麻街的 Elmo 的巴勃罗毕加索风格的照片”，这就是我们得到的（是的，这是最好的）：

能够以已故艺术家的风格创作艺术品可能不会引起太多警钟，尤其是在一种如此知名的风格中。但对于通过 ArtStation、DeviantArt、Behance、个人网站和社交媒体页面（如 Instagram 或 Facebook）分享他们的创作的现代艺术家来说，这更令人担忧。

那么你能做些什么来保护你自己的创作不被用来训练一个可以比你更快地吐出创作的人工智能呢？

选择退出训练数据集

您可以使用 HaveIBeenTrained.com 选择退出互联网上最大的两个开放图像训练数据集 LAION-400M 和 LAION-5B。这些数据集被网络上一些最大的图像生成器使用，包括 Stable Diffusion 和 Google Imagen。因为它们是真正开放的，所以许多其他生成式 AI 工具也使用它们。

不幸的是，这样做的过程缓慢而乏味。您需要先注册一个帐户，然后搜索或上传图像以在数据集中查找匹配项。然后，您可以在桌面网络浏览器中右键单击该图像，然后选择“添加到我的退出”选项。或者，您可以通过单击“添加到我的选择加入”来授予数据集使用图像的明确权限。

您需要为找到的每张图像执行此操作，因此如果您是一位拥有大量作品的艺术家，这可能是一个艰苦的过程。实际上需要多长时间最终取决于过滤掉你的作品的难易程度，如果你的作品与一个独特的名称或项目相关联，有大量的在线追随者等等，这可能会更容易。

尽管这两个庞大的数据集是一个很好的起点，但它们远非唯一使用的数据集。个人可以创建自己的数据集，有些人可以复制特定的艺术家或艺术风格。像 OpenAI 这样的一些公司根本不透露他们的工具使用了哪些数据集，所以没有办法对抗这些。

使用 Robots.txt 抵御爬虫

robots.txt 文件是放置在网站根目录中的一个小文本文档，用于告诉网络爬虫允许或不允许它们去哪里。尽管 Google 明确声明“这不是一种让网页远离 Google 的机制”，但如果您将其托管在自己的网站上，您可能仍想尝试使用它来让网络爬虫远离您的作品。

顾名思义，网络爬虫在网络上爬行以搜索索引内容。搜索引擎远非唯一的爬虫，爬虫还用于创建数据集，很像上面提到的 LAION-400M 和 LAION-5B 数据集。 robots.txt 的主要问题是它依赖于网络爬虫尊重您的请求。

最大的数据集之一是 Common Crawl，其中的数据已用于构建 LAION 的数据集。抓取网络的过程是一个持续的过程，LAION 表示其当前（在撰写本文时）LAION-400M 数据集是“从 2014 年至 2021 年期间抓取的随机网页”创建的。

Common Crawl 声明它在阻止内容和延迟抓取（以节省带宽）方面尊重 robots.txt 和机器人排除协议。您可以通过在 Robots.txt 文件中为“CCBot”用户代理创建规则来做到这一点。当然，如果您不自行托管您的作品，这些都无济于事。

Google 搜索中心有一个创建 robots.txt 文件的便捷指南，或者您可以使用像 Ryte 的 Robots.txt 生成器这样的网站为您创建一个。您可以允许或禁用来自特定目录的特定用户代理，或者简单地使用通配符 (*) 阻止所有内容。例如，一个 robots.txt 文件会阻止 Common Crawl 访问您 /images/ 目录中的所有文件，同时仍允许其他爬虫程序为您的网站编制索引，其内容如下：

User-agent: CCbot
Disallow: /images/

User-agent: *
Allow: /

Sitemap: https://www.example.com/sitemap.xml

这不会打败已经访问过您网站的爬虫，但它应该可以防止 Common Crawl 将来索引您的 /images/ 文件夹（以及自上次爬取以来的任何新上传）。

版权您的作品

尽管版权隐含在您创作的作品中，但不遗余力地为您的作品争取版权也可能是值得的。在美国，您可以通过在 Copyright.gov 上注册您的作品来做到这一点。您可以在一个申请中提交最多 10 件未发表的作品，但请注意，处理您的作品可能需要一段时间（目前大约一年）。

为您的作品注册版权可以让您在涉及法院的事务中更有立足之地。这就是针对 Stability AI（Stable Diffusion 和 DreamStudio 的开发者，LAION 的资助者）、DeviantArt（艺术家平台和 DreamUp 的开发者）和代表受影响艺术家的生成艺术应用程序 Midjourney 提起集体诉讼背后的想法.

您可以在 StableDiffusionLitigation.com 上阅读有关诉讼的所有信息，如果您认为您的工作已被用于训练这些生成器，那么您可能有理由通过联系法律团队来加入集体诉讼。如果您想沿着这条路走下去，那么向美国版权局申请注册您的艺术作品是重要的第一步。

就像过去吸引律师的其他做法一样——盗版、越狱、文件共享——诉讼不太可能完全阻止这种做法。辩方可能会争辩说，这些工具是根据从面向公众的网站收集的“合理使用”材料进行培训的。我们将不得不拭目以待，看看此类诉讼会产生什么影响（如果有的话）。

激进水印

如果您只上传带有一些激进或边缘自毁水印的艺术作品，则数据集中包含的艺术作品将反映这一点。最终，这在很大程度上取决于首先上传您的作品的原因。如果您是为了享受互联网而创作非商业性的艺术品，这似乎最终会弄巧成拙。

但是，如果您销售的是真实世界的画作，并希望在销售前在线展示它们，这可能会有所帮助。它肯定会影响完成的艺术品，所以这是你必须自己考虑的事情。

不要在互联网上上传您的作品

这听起来可能很荒谬（确实如此），但如果你的作品一开始就没有上传到互联网，它就不可能被抓到网上并用于训练人工智能。当然，如果不使用互联网分享您的作品而以艺术家的身份谋生可能几乎是不可能的（尤其是如果您使用数字媒体工作）。

对于从事音乐工作的艺术家来说，这是不可能的。即使您使用油画或水彩等传统材料，也无法判断是否有人会为完成的作品拍照并自行上传。

人工智能艺术能获得版权吗？

生成式 AI 的输出是否可以受版权保护是一个复杂的问题。普遍接受的一件事是，用于生成艺术的人工智能工具很少对输出有任何权利。

这在大多数工具的服务条款中都有明确说明，包括 Stable Diffusion：

除此处规定外，许可方对您使用模型生成的输出不主张任何权利。您对您生成的输出及其后续使用负责。任何输出的使用都不能违反许可证中规定的任何条款。

该许可证继续禁止任何“违反任何适用的国家、联邦、州、地方或国际法律或法规”的使用，其中包括版权法。

中途：

在现行法律允许的范围内，您拥有您使用服务创建的所有资产。这不包括放大其他人的图像，这些图像仍归原始资产创建者所有。

和 OpenAI（DALL-E 2）：

在双方之间，在适用法律允许的范围内，您拥有所有输入，并且在您遵守这些条款的前提下，OpenAI 特此向您转让其对输出的所有权利、所有权和利益。

关于使用此类工具创作的任何作品的版权，美国版权局已声明版权仅适用于人类创作的艺术（以及其他要求，如原创性）：

在声称非人类作者身份的情况下，上诉法院发现版权不保护所谓的创作。

法律在不断发展，所以这在未来可能会被成功挑战。还值得注意的是，即使其他元素（如艺术作品或音乐）不是 AI 生成器的产品（如情节或对话），最终产品的元素仍然可以获得版权。

人工智能艺术生成器可以使用我受版权保护的艺术吗？

问题不一定是 AI 生成器“可以”使用您的受版权保护的艺术作品，而是他们“是否”使用您的受版权保护的艺术作品已经。正如许多艺术家发现的那样，这个问题的答案是肯定的。上面我们讨论了一些选择退出数据集和防止爬虫将您的内容编入索引的方法，但这些技术最终取决于掌舵人是否尊重您的偏好。

您可以使用 HaveIBeenTrained.com 查看您的艺术作品是否包含在最大的公共图像数据集中。上传您较为知名的艺术作品之一，或搜索您的姓名、作品名称、网络漫画或其他创作并查看。如果您看到自己的作品出现在网站上，则表明您的作品包含在 Stable Diffusion 和其他公司使用的数据集中。

更不用说其他不公开正在使用哪些数据集的生成艺术应用程序（如 OpenAI 的 DALL-E）。您可以随时尝试提示“您的名字风格的艺术品”，看看是否有任何熟悉的东西出现。

即将推出的工具可能有助于击败 AI 艺术生成器

艺术家可能会有一些希望以工具的形式出现，这些工具可以使生成人工智能更难根据数据集中的图像复制艺术品。不幸的是，这些解决方案还没有出现（在撰写本文时），而且从长远来看它们的效果如何也不得而知。人工智能工具发展迅速，因此它们有可能发展以规避此类保护措施。

第一个是 Glaze，这是芝加哥大学的一个项目，在上传之前对艺术品“添加非常小的变化”。开发人员将这些变化称为“风格斗篷”，并指出艺术作品在人眼看来与原作几乎相同，同时导致 AI 将风格误解为另一种风格。

Glaze 将作为适用于 Mac 和 Windows 的应用程序发布，因此无需离开艺术家的计算机即可“隐藏”艺术品。开发人员表示他们不会将该工具商业化，因此任何人都可以免费使用。 Glaze 项目将该工具视为“迈向以艺术家为中心的保护工具以抵制 AI 模仿的必要的第一步。”

墨尔本大学 Pursuit 博客中概述的另一种技术描述了噪声的微妙使用，这种噪声“改变图像中刚好足够的像素来混淆 AI，并将其变成‘无法学习的’图像。”该机构声称已经提出了一种利用模型弱点的技术，甚至将 Stable Diffusion 等工具描述为“懒惰的学习者”。

这种技术具有广泛的潜在用途，包括视觉艺术作品以及可以识别您个人身份的音频和照片。重要的是要认识到这些技术在开发方面仍处于早期阶段，因此我们必须拭目以待，看看它们的真正能力。

机器人的崛起

生成艺术应用程序可以立即创作艺术品，但它们并不像人类那样真正具有创造力。 ChatGPT 或许可以写你的简历，但你需要仔细校对它，因为聊天机器人通常会自信地犯错。

归根结底，当前的人工智能解决方案可能有用，但也很薄弱。