最近学习了 一下 如何爬取数据 而后就接触了 八爪鱼 数据分析 这个软件浏览器
详细信息访问这个:http://www.bazhuayu.com/tutorial/hottutorial/shfw/xfdp服务器
对于某些用户来讲,直接自定义规则可能有难度,因此在这种状况下,咱们提供了网页简易模式,网页简易模式下存放了国内一些主流网站爬虫采集规则,在你须要采集相关网站时能够直接调用,节省了制做规则的时间以及精力。学习
对于咱们采集用户来讲,美团数据抓取下来能够分析每一家商铺的价格,销量,位置,人均消费,好评率等各类主要信息,帮助你作出更好的判断,分析当下主流消费用户的消费状况。网站
因此本次介绍八爪鱼简易采集模式下“美团爬虫规则”的使用教程以及注意要点。url
一、打开/download,即八爪鱼软件官方下载页面,点击图中的下载按钮。spa
二、软件下载好了以后,双击安装,安装完毕以后打开软件,输入八爪鱼用户名密码,而后点击登录excel
一、进入登录界面以后就能够看到主页上的网站简易采集了,选择当即使用便可。教程
二、进去以后即可以看到目前网页简易模式里面内置的全部主流网站了,须要采集美团内容的,这里选择第四个--美团便可。get
三、美团爬虫规则下内置了不少经常使用的采集规则,你们能够根据自身实际需求选择相应的规则,这里仅以“美团-》商家信息-关键词搜索”这条爬虫规则举例说明,点击“当即使用”便可使用。数据分析
四、美团-商家信息-关键词搜索简易采集模式任务界面介绍
查看详情:点开能够看到示例网址
任务名:自定义任务名,默认为美食商家列表信息采集
任务组:给任务划分一个保存任务的组,若是不设置会有一个默认组
城市页面地址:输入你要在美团网上采集的城市url(可放入多个)
搜索关键词:设置你要搜索的关键词,填入便可
示例数据:这个规则采集到的全部字段信息。
五、 美团数据抓取规则设置示例
例如要采集南昌市全部烧烤类的商家信息
在设置里以下图所示:
任务名:自定义任务名,也能够不设置按照默认的就行
任务组:自定义任务组,也能够不设置按照默认的就行
城市页面地址:http://nc.meituan.com/
搜索关键词:烧烤
注意事项:URL列表中建议不超过2万条,大量的URL能够经过八爪鱼先抓取美团里每个城市的url,少许可直接去浏览器里获取。
一、设置好爬虫规则以后点击保存。
二、保存以后,点击会出现开始采集的按钮。
三、 选择开始采集以后系统将会弹出运行任务的界面,能够选择启动本地采集(本地执行采集流程)或者启动云采集(由云服务器执行采集流程),这里以启动本地采集为例,咱们选择启动本地采集按钮。
四、选择本地采集按钮以后,系统将会在本地执行这个采集流程来采集数据,下图为本地采集的效果。(因为数据量较大,我这展现可以采集到数据后手动中止了)
五、采集完毕以后选择导出数据按钮便可,这里以导出excel2003为例,选择这个选项以后点击肯定。
六、而后选择文件存放在电脑上的路径,路径选择好以后选择保存。
七、这样美团上南昌市关于烧烤类的商家数据就被完整的采集导出到本身的电脑上来了。
爬取数据就是这么的简单哦