Python爬虫大众点评字体加密评论采集!听说这个网站很难?

前序 最近在研究反爬虫策略,写了一个大众点评评论采集的程序,途中遇到了一些坑有感而发分享给大家, 大众点评是基于css机制实现的字体加密技术来阻碍我的进行准确数据的抓取     正文   图1 根据图1我们可以看出部分文字在源码中是无法得到正常显示的,对应的我们解析也只能得到一些无用的svg标签,且又由于文字本身就是一个svg标签所以此时我们的selenium也爱莫能助,初步认定字体正确显示在网页
相关文章
相关标签/搜索