刚开始爬取了 百度图片和搜狗图片html
可是图片不是不少,随后继续爬取淘宝图片,可是淘宝反爬比较厉害 以前的方法不能用git
记录可行的 淘宝爬取 利用selenium爬取github
https://cloud.tencent.com/developer/article/1151774正则表达式
githubide
https://github.com/Python3WebSpider/TaobaoProducthtm
(须要修改代码,本身扫码登录 继续爬)看issuesblog
注意:爬多了 肯能出现滑块验证 使用开发者模式避免图片
利用pyquery进行搜索 就不须要正则表达式了开发
使用方法get