Scrapy爬取智联招聘

以前接了一个活,作的功能是从智联招聘爬取招聘信息
赚了几百块零花钱
实现了一个GUI,如图:
智联招聘GUI
虽然比较丑low,可是简洁明了,落落大方(已是我水平的天花板了)
具体功能说明就不了,你们都能看懂的。。。。
智联招聘连接
url:http://sou.zhaopin.com/网页界面.png
网页是这个样子的,反爬虫不强。
还实现了一个功能,就是定时发送邮件
如图:
发送邮件GUI
具体功能说明就不了,你们都能看懂的。。。。
接下来就要开源代码了,原本想上传文件,可是发现思否不支持(好像其余博客也不行。。。。。)
因此准备发到github上了。
Github连接呢
githubpython

顺便说一下思路:
网页参数jl是控制地区的git

#下拉列表(地区)
area={
    '全国': 489,
    '北京': 530,
    '上海': 538,
    '深圳': 765,
    '广州': 763,
    '天津': 531,
    '成都': 801,
    '杭州': 653,
    '武汉': 736,
    '大连': 600,
    '南京': 635,
    '苏州': 639,
    '西安': 854,
}

kw参数就是搜索关键词
https://sou.zhaopin.com/?jl=6...
图片描述
def start_requests(self):发送请求
def parse(self, response):解析列表,发送子请求(为了获取详情)
def re_parse(self, response):解析具体内容github

最后,网页时动态渲染的,因此在middleware加了一个selenium,毕竟scrapy自己不支持动态渲染。但这也破坏了scrapy的异步结构,因此,速度不是很理想,但够用。异步

详情的话,具体看代码吧。乏了。scrapy

相关文章
相关标签/搜索