月薪20k+爬虫工程师必备技能-字体反爬

现在越来越多的网站为了反爬虫已经开始在字体上下功夫了,主要表现为在浏览器上文字显示正常,但是用爬虫抓取下来的却是乱码。比如58同城、猫眼电影、实习僧等网站。不过一般字体反爬只会针对一些数字而不是全部文字,为什么这样?看下面的细节就知道啦。 字体反爬原理: 网页开发者自己创造一种字体,因为在字体中每个文字都有其代号,那么以后在网页中不会直接显示这个文字的最终的效果,而是显示他的代号,因此即使获取到了
相关文章
相关标签/搜索