首先看看如何快速查看剩余火车票?html
当你想查询一下火车票信息的时候,你还在上12306官网吗?或是打开你手机里的APP?下面让咱们来用Python写一个命令行版的火车票查看器, 只要在命令行敲一行命令就能得到你想要的火车票信息!若是你刚掌握了Python基础,这将是个不错的小练习。python
接口设计正则表达式
一个应用写出来最终是要给人使用的,哪怕只是给你本身使用。因此,首先应该想一想你但愿怎么使用它?让咱们先给这个小应用起个名字吧,既然及查询票务信息,那就叫它tickets好了。咱们但愿用户只要输入出发站,到达站以及日期就让就能得到想要的信息,因此tickets应该这样被使用:chrome
$ tickets from to date
另外,火车有各类类型,高铁、动车、特快、快速和直达,咱们但愿能够提供选项只查询特定的一种或几种的火车,因此,咱们应该有下面这些选项:数据库
这几个选项应该能被组合使用,因此,最终咱们的接口应该是这个样子的:浏览器
$ tickets [-gdtkz] from to date
接口已经肯定好了,剩下的就是实现它了。网络
开发环境函数
写Python程序的一个良好实践是使用virtualenv这个工具建一个虚拟的环境。咱们的程序使用Python3开发,下面在你的工做目录下建一个文件夹tickets,进去建立一个虚拟环境:工具
$ virtualenv -p /usr/bin/python3 venv
解析参数测试
Python有不少写命令行应用的工具,如argparse, docopt, options...这里,咱们选用docopt这个简单易用的工具,咱们先安装它:
$ pip3 install docopt
docopt能够按咱们在文档字符串中定义的格式来解析参数,在tickets.py中:
下面咱们运行一下这个程序:
$ python3 tickets.py 上海 北京 2016-07-01
咱们获得下面的参数解析结果:
获取数据
参数已经解析好了,下面就是如何获取数据了,这也是最主要的部分。首先咱们打开12306,进入余票查询页面,若是你使用chrome,那么按F12打开开发者工具,选中Network一栏,在查询框钟咱们输入上海到北京,日期2016-07-01, 点击查询,咱们在调试工具发现,查询系统实际上请求了这个URL
https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP
而且返回的是Json格式的数据!接下来问题就简单了,咱们只须要构建请求URL而后解析返回的Json数据就能够了。可是咱们发现,URL里面from_station和to_station并非汉字,而是一个代号,而用户输入的是汉字,咱们要如何获取代号呢?咱们打开网页源码看看有没有什么发现。
啊哈!果真,咱们在网页里面找到了这个连接:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955
这里面貌似是包含了全部车站的中文名,拼音,简写和代号等信息, 咱们在项目目录下将它保存为stations.html。可是这些信息挤在一块儿,而咱们只想要中文名和大写字母的代号信息,怎么办呢?
BINGO!正则表达式,咱们写个小脚原本匹配提取出想要的信息吧, 在parse.py中:
咱们运行这个脚本,它将以字典的形式返回全部车站和它的大写字母代号, 咱们将结果重定向到stations.py中,
$ python3 parse.py > stations.py
咱们为这个字典加名字,stations, 最终,stations.py文件是这样的:
如今,用户输入车站的中文名,咱们就能够直接从这个字典中获取它的字母代码了:
万事俱备,下面咱们来请求这个URL获取数据吧!这里咱们使用requests这个库, 先安装它:
$ pip3 install requests
它提供了很是简单易用的接口,
从结果中,咱们能够观察到,与车票有关的信息须要进一步提取:
显示结果
数据已经获取到了,剩下的就是提取咱们要的信息并将它显示出来。prettytable这个库可让咱们它像MySQL数据库那样格式化显示数据。
$ pip3 install prettytable
这样使用它:
其次咱们看看如何自动抢:
做者:marvin,互联网从业者,现居上海张江
使用Python+Splinter自动刷新抢票,能够成功抢到。(依赖本身的网络环境太厉害,还有机器的好坏)
Splinter是一个使用Python开发的开源Web应用测试工具,它能够帮你实现自动浏览站点和与其进行交互,Splinter执行的时候会自动打开你指定的浏览器,访问指定的URL。而后你所开发的模拟的任何行为,都会自动完成,你只须要坐在电脑面前,像看电影同样看着屏幕上各类动做自动完成而后收集结果便可。
12306抢票Python代码片断
实现自动登陆的函数:
开始购票的函数