主要思路python
目的:cookie
根据输入的城市名,爬取该城市美团美食板块全部商家的数据。数据包括: ide
店名、评分、评论数量、均价、地址,工具
并将这些数据存入Excel中。开发工具
最后尝试对爬取到的数据作一个简单的分析。 spa
克服反爬虫:code
爬取每页数据后,随机中止一段时间后再爬下一页;blog
每页使用不一样的cookie值。ip
具体原理:unicode
详细的实现过程见源代码。
开发工具
Python版本:3.5.4
相关模块:
requests模块;
win_unicode_console模块;
openpyxl模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装须要的相关模块便可。
相关文件
关注公众号“python工程狮”回复“美团美食”获取。
使用演示
在cmd窗口运行MT_Cate_Spider.py文件便可。
简单分析
利用Excel的数据分析功能简单分析
用的上海地区的数据。
首先固然是按照评分排个序,而后作成柱状图:
而后是评论数量排个序,作成柱状图:
而后再作点其余有趣的图案: