不少难以采集的网站都使用selenium爬取,可是后来发现selenium
有特征值,会被检测出来,今天来小结一下反反爬方案
测试网站 全绿好像表明没被检测出html
网上不少都是这种博客,不知道靠不靠谱python
这种python的异步请求库,彷佛极好的解决了
简书博客web
彷佛使用开发者模式能够避免被检测,还须要测试
[python+selenium代码]chrome
options = webdriver.ChromeOptions() options.add_experimental_option('excludeSwitches', ['enable-automation'])