为何看博客的时候里面的连接老是 404

为何看博客的时候里面的连接老是 404

做为一个野路子程序员,看大牛的博客是学习,进步的很重要的一个信息来源。
做为一个信息的汇聚点,博客中总会引用些其余的经典文章,或是某开源项官方文档中的重要部分。
然而因为更新博客是很低频率的事件,因此随着时间推移,极可能发生的状况是:大牛引用的另外一篇文章
已经被删除,或者干脆域名到期,引用的博客关门大吉;因为开源项版本升级,原先的文档已经不适用于是
官方删除了。
So, 404...css

现状

尝试测试了 阮一峰(http://www.ruanyifeng.com/blog/), 王垠(http://www.yinwang.org/) 等知名博主的博客,发现几乎都有连接失效的问题。
可见此问题很常见。git

博主

大多数的博主并非经过写博客盈利赚钱,因此不可能按期去检查之前博文中的连接是否有效。
话说回来,即使真的是经过写博客盈利赚钱,那么多的博文,也不太可能按期去检查之前博文中的连接是否有效吧。。程序员

读者

虽然对我很不友好,破坏了上下文和文章的完整性,可是
习惯了。。认了吧。。。凑合看吧。。github

中国特点

因为众所周知的缘由,中国读者遇到引用连接不可访问的状况更多,而且不可访问的连接愈来愈多。服务器

做为一个独立开发者,用了若干个第三方服务,CDN 等。天有不测风云风云,保不齐哪天哪一个服务商就黄了,或者哪一个 CDN
又被墙了。。。网络

尝试解决

一个可能的解决方法 link doctor学习

https://doctor.dry.ninja/测试

博主(站长)在网站注册后,系统尝试按期(每6小时1次,可设定)对网站进行一次分析,找出失效的引用的连接,或是失效的引用的资源(js, css),
并将分析结果发送给博主(站长)。网站

目前刚刚有想法作这个东西,并作了个简单的 Demo。
在检测的全面性和精准度方面还不作保证。若是真的有博主有这个需求,请收藏、标星。若是没有人有需求的话,就弃坑了。。
或者有什么好的建议的话,欢迎提个 issue。blog

github 地址在此:
https://github.com/FingerLiu/link-guard

待解决问题

  • 爬虫被 ban
  • 因为国内和国内网络环境不一样,分别部署不一样的服务器
  • 什么须要检测什么不须要
  • 对引用的连接进行备份(snapshot)。
相关文章
相关标签/搜索