爬虫一听就头大,高科技啊,python学了,好久不用,忘记的快;别急,今天又发现一款好工具,就教你3分钟,爬取所有想要的职位数据;小白傻瓜操作,完全压力;
步骤1:电脑下载后羿采集器
步骤2:采集数据
步骤3:整理excel数据
步骤1:工具准备:用电脑下载“后羿采集器”,免费的,安装好;
官方下载网址:http://www.houyicaiji.com/
下载安装好的页面如下:
步骤2:开始数据采集:
1、找到目标网址,我们以拉勾网为例,百度搜“拉勾网,”进入拉勾网,职位上输入“风险政策”;
效果如下:
2、确定是自己想要的搜索之后,复制网址;如上图复制网址的地方
我把网址复制来了,也可以直接用下面的网址:
https://www.lagou.com/jobs/list_%E9%A3%8E%E9%99%A9%E6%94%BF%E7%AD%96%E5%88%86%E6%9E%90/p-city_3?&cl=false&fromSearch=true&labelWords=&suginput=
3、打开后羿采集器,点智能模式
4、跳出的页面,输入采集数据的网址:
5、然后点击“立即创建”,会跳转到以下页面:
你可以在这个页面管理你想要采集的字段信息,比如增加或者删除;右键有删除字段;如果要添加,则点击【添加字段】、然后【直接移动】到需要采集的内容上,【点击】需要采集的内容。
6、点击“开始采集”,跳出以下页面,可以按需设置,也可以默认不设置,点启动
点击启动后,就可以看到正在采集数据了
可以点击停止,
7、跳出以下界面,点导出数据即可
以下页面按需设置:
点击查看导出的文件
8、查看数据,清洗数据即可
至此,爬虫结束,
有没有超级惊奇!!!!!!没想要这么简单,我和你一样惊喜
快来试试看,搜搜学区房的房价如何?
本文参考圈里圈外课程学习,鸣谢;