介绍requests+threading多线程爬虫,提取采用xpath 和正则两种,介绍线程锁

爬虫专业的都喜欢scrapy框架,但scrapy上手需要时间,对初学者不太适合。 本文介绍使用requets爬虫,为了利于演示学习,使用了xpath解析html和完全使用正则来提取两种方法,仅供参考。 代码是爬取http://esf.sz.fang.com/,房天下网站的深圳二手房信息 import requests,json,random import re,threading from lxm
相关文章
相关标签/搜索