字体反爬详解

目前网页的字体多样化完全可以自定义,常见有eot,woff,ttf格式类型 本次爬虫就针对以woff格式的字体而言: 先看看不做措施造成的影响: http://maoyan.com/ 以猫*票房信息为例 调试模式下票房数字是乱码的,在源代码中则是“&#xxxxx”的一窜字符     故,不做措施直接爬取的数据是乱码的,就是调试模式中看的内容   怎么做   在源码中我们可以看到有woff的踪迹 这
相关文章
相关标签/搜索