Scrapy+Seleium+headless无头浏览器爬取天眼查数据

时间 2021-01-20

原文原文链接

#难点： 1.数据接口很难找到，反爬措施很强，所以用的seleium模拟抓取 2.页面数据字体进行了异常，需要进行反向破解 ###本文用的是天眼查移动端 m.tianyancha.com 进行抓取，输入公司名可以抓取前面5条具体信息展示 ###还有网站字体异常反爬每天都会更新，所以需要后面使用的需要排除去除，用fontcreator软件 ###代码抓取也有些注意点，用的google无头headle

>>阅读原文<<