快下班了,正好准备去买彩票,就顺手写了2个脚本,一个用来下载最近的彩票数据,一个用来统计彩票数字,分享给你们!python
数据来源本身看吧~用外链通不过。。。函数
所用库:xlwt,requests,lxml3d
有几点须要注意的:excel
一、构建列表。由于存入excel文件的时候用的是列表,因此新建一个函数,分别取网页5个数据:时间、期数、开奖数123,而后每一页嵌套写入列表相似结构为[[时间、期数、开奖数1,2,3],[时间、期数、开奖数1,2,3]……],在循环页数,获取全部的数据!注意构建列表的形式和列表结果,这个在你写入表格的时候很重要!xml
二、写入数据。xlwt写入文件的方法为ws.write(行,列,数据),按行写入文件,因此新建一个变量line(代码第36行),每写入一行自增1。blog
其余方面都很简单,没有反爬,就是为了获取数据,好作分析!requests
最后excel表中的数据是这样的:pandas
最后大概有4840行数据,足够咱们分析的了!it
用xlrd库就能够~话说xlwt库和xlrd库好像就是一个写数据,一个读数据。。。io
就写了一个抓热门数字的,也就是取频率最高的。若是您有更好的想法或者玩法,能够自行去实现哦!
先读取数据,而后取到每一行的2.3.4列,每一列写入一个列表(如今有些后悔,不应写那么多数据进来),而后3个列表合并一个总列表,这样咱们就有了4个列表,取出每个列表中出现次数最多的那个数字,代码以下:
第1个数字频率最高的是 [3]
第2个数字频率最高的是 [6]
第3个数字频率最高的是 [8]
单个数字频率最高的是 [3]
由于赶时间下班。。就所有用了列表推导式,也没有用pandas库或者可视化库作出很炫酷的图表,等我研究出完美的预测方案的时候在作【手动哭泣】,不过依如今的趋势,是没什么但愿了。。。
最后要说的是,从开始研究分析各类数据到如今习惯性的买彩票,没中过大奖(超过200的都算大奖)!果真童话都是骗人的……仍是学python比较好玩!