爬虫 解析 加密字体 例子58 同城

一些网站 会将部分内容进行加密,防止爬虫简单的获取到信息 最近 在爬取58同城的品牌公寓时 遇到租房信息里的价格 爬下来是看不懂的字体 一些数据在浏览器里面显示是正常的, 但是渲染前和渲染后的html源码都看不到字体, 渲染前看到的是16进制的4位字符, 渲染后看到的是一些方块. 然后分析了一下网站的源码,发现他是由base64 加密之后生成的字体 那我们就可以通过正则匹配出来进行处理 首先在ht
相关文章
相关标签/搜索