python爬虫之字体反爬虫

原因 今天下午在抓取一个网页时,发现的网页字体反爬,这种情况一句话总结:即网页文本里的数字与网页上显示的字体不一致。为什么会出现这样的情况呢?原因是开发者在网页文本里引入了改变字体的文件。 然后可以看到,这是网页文本里的数字: 这是网页显示数字: 手段并不是太高明,这个动态网页比,难度还是不大的。 解决办法如下: 在请求完网页下载完网页文本后,找到网页文本里字体的源地址: 然后,把它下载下来并保存
相关文章
相关标签/搜索