封装了一些 python 爬虫技巧,开箱即用

源 / Python开发者(PythonCoder) 这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。 1.最基本的抓站 importurllib2 content = urllib2.urlopen( http://XXXX ).read() 2.使用代理服务
相关文章
相关标签/搜索