java解析sina视频
程序员文章站
2024-02-21 20:23:28
用一个例子来说明,比如这个http://video.sina.com.cn/v/b/75314002-1648211320.html。用火狐打开,开启firebug,得到如...
用一个例子来说明,比如这个http://video.sina.com.cn/v/b/75314002-1648211320.html。
用火狐打开,开启firebug,得到如下信息。
其中在这个请求
http://v.iask.com/v_play.php?vid=75314002&uid=1648211320&pid=478&tid=&plid=4001&prid=ja_7_3485822616&referrer=&ran=0.2936802236363292&r=video.sina.com.cn
中得到的响应有我们想要的xml信息,其中vid就是上面红色部分,uid后面的都可以忽略,我们在浏览器中直接输入http://v.iask.com/v_play.php?vid=75314002还是可以得到相同的信息。自此解析的思路就变清晰了,在视频链接中提取出vid,使用http://v.iask.com/v_play.php?vid=得到xml文件,解析xml文件就可以得到真实视频地址了。
下面的是解析xml的代码,使用sax解析xml。首先定义xml reader。
复制代码 代码如下:
package hdu.fang.parser;
import hdu.fang.model.video;
import java.util.arraylist;
import java.util.list;
import org.xml.sax.attributes;
import org.xml.sax.saxexception;
import org.xml.sax.helpers.defaulthandler;
public class xmlsaxreader extends defaulthandler {
private list<video> videos = null;
private video video = null;
private long timelength = null;
private string tag = null;
@override
public void startdocument() throws saxexception {
videos = new arraylist<video>();
}
@override
public void startelement(string uri, string localname, string qname,
attributes attributes) throws saxexception {
if ("durl".equals(qname)) {
video = new video();
}
tag = qname;
}
@override
public void endelement(string uri, string localname, string qname)
throws saxexception {
if ("durl".equals(qname)) {
videos.add(video);
video = null;
}
tag = null;
}
@override
public void characters(char[] ch, int start, int length)
throws saxexception {
if (tag != null) {
string data = new string(ch, start, length);
if ("timelength".equals(tag)) {
timelength = long.valueof(data);
} else if ("order".equals(tag)) {
video.setorder(integer.valueof(data));
} else if ("url".equals(tag)) {
video.seturl(data);
} else if ("length".equals(tag)) {
video.setlength(integer.valueof(data));
}
}
}
public list<video> getvideos() {
return videos;
}
public long getlength() {
return timelength;
}
}
video类是我自己定义的一个数据model。在主函数里我们只要调用sax工厂实例化解析器就行了。
复制代码 代码如下:
saxparserfactory sf = saxparserfactory.newinstance();
saxparser sp = sf.newsaxparser();
xmlsaxreader reader = new xmlsaxreader();
inputstream in_withcode = new bytearrayinputstream(
xml.getbytes("utf-8"));//xml就是刚得到的xml文件,类型string
sp.parse(in_withcode, reader);
videos=reader.getvideos();//得到video list
timelength=reader.getlength();//得到视频长度
system.out.println(videos);
在xml文件里还有很多其他信息,都可以解析出来,看自己需要了。