火车票买不到?看我用python监控票源
程序员文章站
2022-04-14 19:44:22
同事说最近火车票难买,我就帮他用个脚本监控 一下。 最近高铁票比较难买,还有什么候补。要不停的刷,才有时候可以捡漏。有时候明明候补了,到快开车告诉你余票不足,候补失败。 凡事预则立,我打算写个脚本提前两个星期就监控起来,这样就可以提高买到票的几率了。 先是考虑用接口,发现行不通,手动打开页面都OK, ......
同事说最近火车票难买,我就帮他用个脚本监控 一下。
最近高铁票比较难买,还有什么候补。要不停的刷,才有时候可以捡漏。有时候明明候补了,到快开车告诉你余票不足,候补失败。
凡事预则立,我打算写个脚本提前两个星期就监控起来,这样就可以提高买到票的几率了。
先是考虑用接口,发现行不通,手动打开页面都ok,就是接口调不到数据。只好曲线救国,用selenium打开页面,用beautifulsoup来获取页面内容。发现打开页面后,可以直接用数据清洗。大概的代码是这样的:
把自己需要乘坐的车次,日期给设定好,当然我这边主要是要算周五跟周一,监控了两个星期的这两天。设置好定时,给自己发邮件。
然后发邮件,大概样子是这样的:
这样上班的时候,就收到邮件,就可以择机买票了。
现在来聊聊,处理web页面,可能用到哪些库。
python对web的操作常用到的库:请求库,解析库,存储库,工具库
1. 请求库
urllib/re是python默认自带的库
例子:
request 可以添加headers
例子:
代理
cookie’
第一种保存cookie方式
2. 解析库:
pip3 install beautifulsoup4