终端查询12306余票

593 查看


运行实例

环境搭建

  • 本次实验是在Python3的环境下完成的,如果电脑里面没有python的话,根据自己所使用的平台(Windows,Linux,Mac),这里下载。如果已经安装了python的,查看一下python版本,确保版本是3.x的。

    $ python -V
    Python 3.5.1
  • 确保环境中已经存在pip3。如果没有,参考这个:安装pip

  • 安装实验需要用到的库:

    $ sudo pip3 install requests prettytable docopt

requests: 使用 Python 访问 HTTP 资源的必备库
docopt :Python3 命令行参数解析工具
prettytable: 格式化信息打印工具,能让你像 MySQL 那样打印数据。就是展示所对齐的表格

实现思路

  • 第一步,我们来看看买票的这个过程。

买票

我们在买的时候,输入了出发地目的地出发日,还点了一个查询。假设,我们把这个过程看作是一个函数的话,那么对于它的所有操作相当于是输入,通过一些系列对输入的处理。获取我们想要的查询结果,即输出

    ...
    # docopt 可以按我们在注释中定义的格式来解析参数
    arg = docopt(__doc__)

    # 出发地:例如,大连
    from_station = station.get(arg['<from>'])

    # 目的地:例如,北京
    to_station = station.get(arg['<to>'])

    # 时间:例如,2016-10-10
    date = arg['<date>']
    ...
  • 第二步,分析查询按钮,如果你使用 Chrome浏览器,那么按 F12 打开开发者工具,选中 Network 一栏,在查询框中我们输入 大连北京,日期 2016-10-10, 点击查询,我们在调试工具可以发现,查询系统实际上请求了这个URL:

    https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-10-10&from_station=DLT&to_station=BJP

    查询URL
  • 第三步,我们发现里面有三个变量对应我们输入的参数:queryDatefrom_stationto_station,可是是以某种代号进行传递。查看网页源代码,我们发现一个文件,里面记录着所有地点信息,是以JSON格式保存。那么,我们可以通过正则表达式,分割字符串,建立一个字典。这样就可以通过我们所输入的汉语地名找到对应的代号。


    车站信息
  • 第四步,这一步也就是最关键的一步了,找到我们需要的信息,然后解析它。再次,查看调试工具里面的信息。OK,所需要的信息找到了。接下来就是漂亮的展示出来了。


    JSON数据

参考资料

代码(200行内):
github:https://github.com/Torival/BlogCode/tree/master/buy%20ticket
其他:
实验楼:https://www.shiyanlou.com/courses/623

如果是在linux平台,赋权后,可以直接执行。

$ sudo chmod +x tickets.py
$ ./tickets.py 大连 北京 2016-10-10