C#实现的优酷真实视频地址解析功能(2014新算法)
序:优酷之前更新了次算法(很久之前了,呵呵。。。),故此很多博客的解析算法已经无法使用。很多大牛也已经更新了新的解析方法。我也在此写篇解析过程的文章。(本文使用语言为c#)
由于优酷视频地址时间限制,在你访问本篇文章时,下面所属链接有可能已经失效,望见谅。
例:http://v.youku.com/v_show/id_xnzk2nti0mzmy.html
1:获取视频vid
在视频url中标红部分。一个正则表达式即可获取。
string getvid(string url)
{
string strregex = "(?<=id_)(\\w+)";
regex reg = new regex(strregex);
match match = reg.match(url);
return match.tostring();
}
2:获取视频元信息
http://v.youku.com/player/getplaylist/videoids/xnzk2nti0mzmy/pf/4/ctype/12/ev/1
将前述vid嵌入到上面url中访问即可得到视频信息文件。由于视频信息过长不在此贴出全部内容。下面是部分重要内容的展示。(获取文件为json文件,可直接解析)
{ "data": [ {
"ip": 1991941296,
"ep": "mwxrtasbjlnb0pbj8ujxadsivuu11wnkxxc=",
"segs": {
"hd2": [
{
"no": "0",
"size": "34602810",
"seconds": 205,
"k": "248fe14b4c1b37302411f67a",
"k2": "1c8e113cecad924c5"
},
{
"no": "1",
},] }, } ],}
上面显示的内容后面都会使用到。其中segs包含hd3,hd2,flv,mp4,3gp等各种格式,并且每种格式下均分为若干段。本次选用清晰度较高的hd2(视频格式为flv)
3:拼接m3u8地址
http://pl.youku.com/playlist/m3u8?ctype=12&ep={0}&ev=1&keyframe=1&oip={1}&sid={2}&token={3}&type={4}&vid={5}
以上共有6个参数,其中vid和oip已经得到,分别之前的vid和json文件中的ip字段,即(xnzk2nti0mzmy和1991941296),但是ep,sid,token需要重新计算(json文件中的ep值不能直接使用)。type比较简单,后面会说。
3.1计算ep,sid,token
计算方法单纯的为数学计算,下面给出计算的函数。三个参数可一次性计算得到。其中涉及到base64编码解码知识,点击查看。
private static string myencoder(string a, byte[] c, bool istobase64)
{
string result = "";
list<byte> bytesr = new list<byte>();
int f = 0, h = 0, q = 0;
int[] b = new int[256];
for (int i = 0; i < 256; i++)
b[i] = i;
while (h < 256)
{
f = (f + b[h] + a[h % a.length]) % 256;
int temp = b[h];
b[h] = b[f];
b[f] = temp;
h++;
}
f = 0; h = 0; q = 0;
while (q < c.length)
{
h = (h + 1) % 256;
f = (f + b[h]) % 256;
int temp = b[h];
b[h] = b[f];
b[f] = temp;
byte[] bytes = new byte[] { (byte)(c[q] ^ b[(b[h] + b[f]) % 256]) };
bytesr.add(bytes[0]);
result += system.text.asciiencoding.ascii.getstring(bytes);
q++;
}
if (istobase64)
{
byte[] byter = bytesr.toarray();
result = convert.tobase64string(byter);
}
return result;
}
public static void getep(string vid, string ep, ref string pnew, ref string token, ref string sid)
{
string template1 = "becaf9be";
string template2 = "bf7e5f01";
byte[] bytes = convert.frombase64string(ep);
ep = ystem.text.asciiencoding.ascii.getstring(bytes);
string temp = myencoder(template1, bytes, false);
string[] part = temp.split('_');
sid = part[0];
token = part[1];
string whole = string.format("{0}_{1}_{2}", sid, vid, token);
byte[] newbytes = system.text.asciiencoding.ascii.getbytes(whole);
epnew = myencoder(template2, newbytes, true);
}
计算得到ep,token,sid分别为diavge+ivmwb5cxxjz8bnhi0ccehxjz0vesh/7ybamzunahqnt/wzw==, 4178, 441265221168712cdf4f8。注意,此时ep并不能直接拼接到url中,需要对此做一下url编码tourlencode(ep)。最终ep为diavge%2bivmwb5cxxjz8bnhi0ccehxjz0vesh%2f7ybamzunahqnt%2fwzw%3d%3d
3.2计算type
type值和选择的segs有密切关系。如本文选择的hd2,type即为flv,下面是segs,type和清晰度的对照。
“segs”,”type”,”清晰度”
"hd3", "flv", "1080p"
"hd2", "flv", "超清"
"mp4", "mp4", "高清"
"flvhd", "flv", "高清"
"flv", "flv", "标清"
"3gphd", "3gp", "高清"
3.3拼接地址
最后的m3u8地址为
http://pl.youku.com/playlist/m3u8?ctype=12&ep=diavge%2bivmwb5cxxjz8bnhi0ccehxjz0vesh%2f7ybamzunahqnt%2fwzw%3d%3d&ev=1&keyframe=1&oip=1991941296&sid=441265221168712cdf4f8&token=4178&type=flv&vid=xnzk2nti0mzmy
4:获取视频地址
将上述m3u8文件下载后,其中内容即为真实地址,不过还需要稍微处理一下。部分内容如下:
#extm3u
#ext-x-targetduration:12
#ext-x-version:3
#extinf:6,
http://59.108.137.14/696cd107fe4d821ffbf173eb3/03000208005430b01849631468defec61c5678-3a78-37ba-1971-21a0d4eea0e7.flv?ts_start=0&ts_end=5.9&ts_seg_no=0&ts_keyframe=1
#extinf:5.533,
http://59.108.137.14/696cd107fe4d821ffbf173eb3/03000208005430b01849631468defec61c5678-3a78-37ba-1971-21a0d4eea0e7.flv?ts_start=5.9&ts_end=11.433&ts_seg_no=1&ts_keyframe=1
#extinf:5.467,
http://59.108.137.14/696cd107fe4d821ffbf173eb3/03000208005430b01849631468defec61c5678-3a78-37ba-1971-21a0d4eea0e7.flv?ts_start=11.433&ts_end=16.9&ts_seg_no=2&ts_keyframe=1
#extinf:9.267,
其中每条url只包含6s左右视频,但是可将url中参数部分去掉即可得到实际的长度。但是每条去掉后需合并一下相同的url,如上述列表可得到url片段
http://59.108.137.14/696cd107fe4d821ffbf173eb3/03000208005430b01849631468defec61c5678-3a78-37ba-1971-21a0d4eea0e7.flv
将m3u8中所有的url片段全部下载即可大功告成。