Scrapy+Seleium+headless无头浏览器爬取天眼查数据

#难点: 1.数据接口很难找到,反爬措施很强,所以用的seleium模拟抓取 2.页面数据字体进行了异常,需要进行反向破解 ###本文用的是天眼查移动端 m.tianyancha.com 进行抓取,输入公司名可以抓取前面5条具体信息展示 ###还有网站字体异常反爬每天都会更新,所以需要后面使用的需要排除去除,用fontcreator软件 ###代码抓取也有些注意点,用的google无头headle
相关文章
相关标签/搜索