当你有了一只美丽的爬虫后你能够作不少有意思的事情,好比爬虫爬到了不少餐饮数据后就能够作餐饮地区活跃度分析了,这些分析指标是颇有意义的,特别是对准备开店的人。
首先要将数据从大众点评、美团或其余网站数据采集下来,方式能够从美食产品入口,而后找到餐饮公司信息,而后找到地址,地区等信息。采集的时候要作好防重策略,这样能够节省不少时间,还有就是不要并发太大,以避免影响正常的业务。将采集到的数据写入数据库,以备后用。
有了这些数据就能够对餐饮公司的分布作统计分析了,能很容易统计出某个城市餐饮公司的地区分布状况,固然你能够找一个好看的数据显示图表进行展现。
只作这些就过于简单了,若是获得餐饮分布的变化状况呢,爬虫另外一个技能,增量采集,这个须要后台进行定时作数据的增量采集,所谓的变化就是在时间轴移动过程当中,Y轴的变更状况,有了增量数据,这个也很容易了。
另外一个须要关注的是哪些餐饮公司比较活跃,生意比较好,一次类推哪些分类的生意比较好,从另外一个角度上来讲就是这个地区的人更喜欢那些餐饮类型,甚至于不一样的季节餐饮喜爱的变化等等。
在这上面有不少事情能够作,有点意思。数据库
转载请注明出处 数荟集(专业数据提供) http://www.shuhuiji.com/detail.jsp?id=9并发