12306放票规律是怎样的,12306车次放票时间

本文的数据采集和统计分析时间为2018年9月,部分数据特征和结论可能与春运高峰时间段不一致 。
春节想胖,想去浪
没有火车票怎么办?
大家按照12306一起努力吧
数据看看
余票放出来有什么规律吗?
这完全是性格问题
还是有一定的规律可循?
▍十行代码带你获得超过12306张选票的数据 。
–通过url获取网页数据
我们选择在12306网站上获取数据 。
你应该熟悉这个界面 。
然后,右键单击page 空-review元素 。
在网络接口中找到请求url 。此URL包含剩余的机票信息 。
让我们用python做一个简单的数据清理 。
剩余的票证数据已成功爬网 。
–使用python,构建自动抓取剩余票据的代码 。
我们使用python的时间表库
构建全天候运行的数据代码 。
不断获取余票数据 。
限于篇幅,在此不再赘述 。
▍:你有机会买到什么样的火车票?
–有票的大区和小区之间无票 。
理论上任何时候都有机会抢到火车票,因为一旦有退票返回系统,12306基本都会实时返回余票库 。
这里的“抢票”定义为有余票且开车时间相对较短的长途大程票 。铁路部门单独出售长途车票,是因为想降低空满载率,实现利润最大化 。
举个栗子:
小长假想去平遥古城玩两天,先看看火车票:
系统显示G627的二等座全部售完,只剩一个一等座 。平遥古城是不是不能去了?不,当然,我们发现平遥古城不是终点站 。这趟列车的终点站是运城北 。
搜索北京到运城北看结果:
结果显示,北京到运城北有余票,余票99张以上 。在这里,我们先大胆猜测一下 。铁路部门认为全程余票卖不出去 。为了降低空的装载率,在可以开售的时候,会放出大量的余票 。接下来我们来验证一下这些余票是怎么放出的 。
▍大数据分析余票发售时间
由于12306改版,余票超过20张时,不会显示具体的号码,显示为“是” 。但实际上,在12306购票和提交订单之前,系统还是会提示实际余票的 。
但登录后长时间爬虫很可能会对账号产生不良影响 。所以建议还需要爬取实际票数的朋友谨慎 。如果他们退一步,可以选择其他销售网站,剩余票数一般可以显示到99 。
非常感谢郑涛老师提供的源数据,里面包含了准确的余票信息 。数据为连续七天的当天列车剩余车票,采集间隔为一分钟 。大家讨论一下如何把剩下的火车票拼在一起 。
–同一趟列车,不同车站的售票时间相同吗?
同一列车不同车站的售票时间是否相同,即售票时间是否与车站有关 。为了验证这个问题,我们选取了当天D306次,对三个区间的剩余票数进行了分析对比 。
这样一来,很明显三个站间的售票时间都集中在中午12: 00和下午18: 30,三个站间的车站没有明显的区别,也就是说这一趟列车的余票的售票时间基本上不随站而异 。
–同一趟列车不同天放票的时间是一样的吗?
我们也以D306次为例,看看连续三天D306次的余票信息 。
我们可以看到,虽然三天的余票不尽相同,但是每天18:25-18:30都有大量余票放出,三天的放票时间非常接近,所以D306上海到南京的车票放票时间在这三天是相对固定的 。
这是普遍现象还是个例?我们把时间拉长,看看第7天的数据是否还符合这个规律 。
从表中可以看出,答案是肯定的,不同日子D306次列车余票发售时间基本一致 。让我们看看其他的火车 。
此外,边肖还观察了不同日期的G1252-苏州至无锡、G7072-丹阳至南京、G7244-无锡至镇江等20趟列车同一区段当日余票的发售情况,发现上述20趟列车的发售时间也有相对固定的时刻 。
–那么,我们可以提前多长时间抢到剩余的放票?
我们把20趟列车的“发车-放行时间”做一个直方图,看看有没有规律 。
根据以上数据,每趟列车的放票时间不尽相同,但我们发现了两个数据非常密集的区段,开车前7小时(420分钟)和开车前1小时(60分钟) 。在实际抢票过程中可以重点关注这两个时段 。
我们来看一下这20趟列车每天售票的时间差,做一个箱线图 。发现大部分车次不同日的售票时间差很小,与我们之前的个别数据基本一致 。
总结与展望
1.通过对这个样本数据的分析,剩余车辆车票发售的时间和车站没有直接的关系,而是因票而异 。
2.大区域票多的时候,小区之间放票的时间相对固定 。这个时间是存在的,只是随车次变化,不受12306网站停止服务的影响 。在大多数情况下,它不是在整点 。比如上午9点发车的D3022,会在凌晨2点左右放票 。如果大面积有票,提前7小时和1小时观察列车的放票情况,有较大概率找到车辆的放票时间 。


推荐阅读