网站搜索

什么是链接失效,它如何威胁网络?


如果您在浏览网页时遇到了 404 错误页面或意外的重定向,您就已经看到链接失效了。随着时间的推移,将网络连接在一起的链接断开,威胁到我们共同的文化历史。这是为什么会发生这种情况。

什么是链接失效?

链接失效是指网站中的链接随着时间的推移而断开,从而创建断开或无效的链接。 “断开的链接”是指链接首次创建时不再指向其预期目标的链接。当您单击其中一个损坏的链接时,您会收到 404 错误,或者您会看到错误的页面或网站。

Link Rot 很常见。哈佛大学 2021 年的一项研究检查了 1996 年至 2019 年超过 550,000 篇纽约时报文章中的超链接,发现指向特定页面的链接中有 25% 无法访问,衰减率急剧增加,具体取决于链接的存在时间(例如,大约 6 2018 年 % 的链接是死链接,而 1998 年 72% 的链接)。另一项研究发现,在 1995 年收集的一组 360 个链接中,只有 1.6% 的链接在 2016 年仍然有效。

为什么会发生链接失效?

网络是一种流动的、去中心化的媒体,没有集中控制,因此内容随时可能在没有警告的情况下变得不可用。服务器来来去去、网站关闭、服务迁移到新主机、软件获得更新、出版物转移到新的内容管理平台并且不迁移内容、域过期等等。

网络上还有另一个相关问题称为“内容漂移”,即链接仍然有效,但链接中包含的内容与原始链接相比发生了变化,这可能会造成麻烦,因为链接的原始作者打算指向不同的信息。

丢失旧网站有什么不好?

事物腐烂和消失是世界的本质。使信息保持活力是一个需要时间、精力和努力的主动过程。因此,链接失效的主要问题不一定是我们需要永远存储所有信息,而是电子信息和参考资料可能比过去主要使用的纸质信息和参考资料变得更加脆弱和脆弱。

许多新闻文章、学术论文甚至法院判决的作者都使用网络链接作为引用机制,为所呈现的信息提供重要的上下文来源。这也是维基百科的一个问题。正如 Jonathan Zittrain 在 2021 年一篇关于 The Atlantic 链接失效的文章中所解释的那样,“采购是将人类知识凝聚在一起的粘合剂。它能让你更多地了解像这篇文章这样的文章中只简要提及的内容,并让其他人仔细检查我所陈述的事实。”

如果链接断开,来源变得不可用,读者就很难判断作者是否诚实准确地表达了原始信息来源。甚至除了链接之外,一些网站还提供在其他任何地方都找不到的在线信息。丢失这些页面会在人类的集体知识中造成差距,并在我们共享的文化结构中造成漏洞。

Link Rot 的解决方案是什么?

专家认为,按照目前的设计,链接失效和内容漂移是网络特有的现象。这意味着它是网络基本性质的一部分,除非我们尝试积极纠正或减轻它,否则它不会消失。

迄今为止,解决链接失效问题最有效的解决方案之一是 1996 年出现的 Internet Archive,它在过去 25 年中维护着数十亿个网站的公共档案。如果您找到损坏的链接,请访问 Internet Archive 的 Wayback Machine 并将链接粘贴到其搜索栏中。如果站点已被捕获,您将能够浏览结果。或者,如果该站点最近出现故障,则可以从 Google 存储的缓存副本中查看原始内容。

在 Internet Archive 之外,哈佛领导的一个名为 Perma.cc 的项目捕获网站的永久版本,目的是长期学术和法律引用。一个图书馆联盟维护着链接,所以他们应该坚持一段时间。目标是创建不会腐烂的链接——只要 Perma.cc 存档被维护,它们就应该持续存在。

链接失效的其他潜在解决方案仍处于前沿,包括潜在的 Web 3.0 解决方案和分布式数据处理,这要归功于 IPFS 等协议。尽管具有讽刺意味的是,数百年后,这个时代唯一幸存下来的网站可能就是人们打印在纸上的网站。在外面注意安全!