字体反爬处理——Python

在爬取网站抓取数据的过程中,有时会遇到这样一种情况:网页浏览正常,开发者模式(F12)查看原来没之后发现关键数据乱码,当然爬取下来的结果也是乱码。这种反爬策略一般称之为字体反爬。 以58同城为例: 用浏览器随便打开58同城的一个页面,F12调出开发者调试窗口: 网页显示正常,调试窗口出现的内容与页面显示不符。 回到网页上,右键查看网页源代码,搜索base64关键字,可以看到一大串用base64加密
相关文章
相关标签/搜索