java抓取12306信息实现火车余票查询示例
最近在弄一个微信的公众帐号,涉及到火车票查询,之前用的网上找到的一个接口,但只能查到火车时刻表,12306又没有提供专门的查票的接口。今天突然想起自己直接去12306上查询,抓取查询返回的数据包,这样就可以得到火车票的信息。这里就随笔记一下获取12306余票的过程。
首先,我用firefox浏览器上12306查询余票。打开firefox的web控制台,选上网络中的“记录请求和响应主体”
然后输入地址日期信息之后点击网页上的查询按钮,就能在web控制台下看到网页请求的地址了:
就是图片中的第二条,即当你点击查询按钮时,处理该事件的实际地址。点开它可以看到
请求网址,请求头,响应头和响应主体这些东西,响应主体里就是我们需要的火车票信息。
有了这个请求网址了就可以到实际代码中进行操作了。可以发现网址的格式是
前面是处理请求的地址,后面接的参数purpose_codes是指成人票(aadult),学生票(自己去试试吧),querydate就是日期,from_station和to_station顾名思义就是出发站和到达站了。这里北京和武汉分别表示为bjp和whn。
到java代码里就可以直接写https请求来获取火车票信息数据包了
public static list<newtrain> getmsg(string startcity,string endcity,int isadult) throws exception{
list<newtrain> trains = new arraylist<newtrain>();
string sstartcity = citycode.format(startcity);
string sendcity = citycode.format(endcity);
trustmanager[] tm = {new myx509trustmanager()};
sslcontext sslcontext = sslcontext.getinstance("ssl", "sunjsse");
sslcontext.init(null, tm, new java.security.securerandom());
// 从上述sslcontext对象中得到sslsocketfactory对象
sslsocketfactory ssf = sslcontext.getsocketfactory();
string type = "adult";
if(isadult == 1){
type = "0x00";
}
string urlstr = "https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes="+type+"&querydate=2014-04-27&from_station="+sstartcity+"&to_station="+sendcity;
url url = new url(urlstr);
httpsurlconnection con = (httpsurlconnection) url.openconnection();
con.setsslsocketfactory(ssf);
inputstreamreader in = new inputstreamreader(con.getinputstream(),"utf-8");
bufferedreader bfreader = new bufferedreader(in);
stringbuffer sb = new stringbuffer();
string line = "";
while ((line = bfreader.readline()) != null) {
sb.append(line);
}
system.out.println(sb.tostring());
}
这段代码的citycode.format()是自己写的将中文的站名转换为字母组合,下面那几行是关于https请求的。网址就是刚才获取到的网址。这段代码执行后得到的输出内容如下:
很容易看出来这些数据是一条条的json数据(我进行了简单的处理,让他一条条打印出来)。
既然是json数据就好办了。取出一条数据来进行分析就可以分析出来key值代表的意思。我只分析了几个我需要的key值
然后就直接写一个train类来储存火车票的信息,便于之后显示用了。
public class newtrain {
private string to_station_name; //到达地
private string station_train_code; //火车编号
private string from_station_name; //出发地
private string start_time; //出发时间
private string arrive_time; // 到达时间
private string lishi; // 需要时间
private string zy_num; // 一等座数量
private string ze_num; // 二等座数量
private string swz_num; // 商务座数量
private string gr_num; // 高级软卧数量
private string rw_num; // 软卧数量
private string rz_num; // 软座数量
private string yw_num; // 硬卧数量
private string yz_num; // 硬座数量
private string tz_num; // 特等座数量
private string wz_num; // 无座数量
}
接下来的工作就很简单了,将json数据放入train类对象中。
好了,基本工作完成了,接下来的工作就是将功能整合到项目里去了。
这其中用到的中文站名跟字母组合的一个txt文件(读txt获取中文站名对应的字母的组合,有一些可能不全