通过Jsoup解析器给抖音短视频去水印
程序员文章站
2022-06-23 13:40:05
...
通过Jsoup解析器给抖音短视频去水印
步骤一:需要下载相应的jar依赖包:
[下载地址](https://repo1.maven.org/maven2/org/jsoup/jsoup/1.11.3/jsoup-1.11.3.jar)
步骤二:直接上源码:
package cn.oop.pack.test;
import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
import java.util.Date;
import java.util.HashMap;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.jsoup.Jsoup;
/**
* o 解析短视频水印,给定抖音短视频的链接,例如:#在抖音,记录美好生活#越简单的步伐越需要训练 https://v.douyin.com/CgPrHJ/ 复制此链接,打开【抖音短视频】,直接观看视频!
*
* @author admin
*
*/
public class Deom01 {
public static void main(String[] args) throws Exception {
// ●抖音链接(使用手机分享功能,复制链接)
String url = "http://v.douyin.com/2MKBC6/";
String url1 = "#在抖音,记录美好生活#越简单的步伐越需要训练 https://v.douyin.com/CgPrHJ/ 复制此链接,打开【抖音短视频】,直接观看视频!";
// 过滤链接,获取http连接地址
String finalUrl = decodeHttpUrl(url1);
// 1.利用Jsoup抓取抖音链接
// 抓取抖音网页
String htmls = Jsoup.connect(finalUrl).ignoreContentType(true).execute().body();
// System.out.println(htmls); //做测试时使用
// 2.利用正则匹配可以抖音下载链接
// playAddr:
// "https://aweme.snssdk.com/aweme/v1/playwm/?video_id=v0200ffc0000bfil6o4mavffbmroeo80&line=0",
// 具体匹配内容格式:「https://aweme.snssdk.com/aweme/...line=0」
Pattern patternCompile = Pattern.compile("(?<=playAddr: \")https?://.+(?=\",)");
// 利用Pattern.compile("正则条件").matcher("匹配的字符串对象")方法可以将需要匹配的字段进行匹配封装
// 返回一个封装了匹配的字符串Matcher对象
// 3.匹配后封装成Matcher对象
Matcher m = patternCompile.matcher(htmls);
// 4.①利用Matcher中的group方法获取匹配的特定字符串 ②利用String的replace方法替换特定字符,得到抖音的去水印链接
String matchUrl = "";
while (m.find()) {
matchUrl = m.group(0).replaceAll("playwm", "play");
}
// 5.将链接封装成流
// 注:由于抖音对请求头有限制,只能设置一个伪装手机浏览器请求头才可实现去水印下载
Map<String, String> headers = new HashMap<>();
headers.put("Connection", "keep-alive");
headers.put("Host", "aweme.snssdk.com");
headers.put("User-Agent",
"Mozilla/5.0 (iPhone; CPU iPhone OS 12_1_4 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/16D57 Version/12.0 Safari/604.1");
// 6.利用Joup获取视频对象,并作封装成一个输入流对象
BufferedInputStream in = Jsoup.connect(matchUrl).headers(headers).timeout(10000).ignoreContentType(true)
.execute().bodyStream();
Long timetmp = new Date().getTime();
String fileAddress = "d:/抖音视频/douyin_" + timetmp + ".mp4";
// 7.封装一个保存文件的路径对象
File fileSavePath = new File(fileAddress);
// 注:如果保存文件夹不存在,那么则创建该文件夹
File fileParent = fileSavePath.getParentFile();
if (!fileParent.exists()) {
fileParent.mkdirs();
}
// 8.新建一个输出流对象
OutputStream out = new BufferedOutputStream(new FileOutputStream(fileSavePath));
// 9.遍历输出文件
int b;
while ((b = in.read()) != -1) {
out.write(b);
}
out.close();// 关闭输出流
in.close(); // 关闭输入流
// 注:打印获取的链接
System.out.println("-----抖音去水印链接-----\n" + matchUrl);
System.out.println("\n-----视频保存路径-----\n" + fileSavePath.getAbsolutePath());
}
public static String decodeHttpUrl(String url) {
int start = url.indexOf("http");
int end = url.lastIndexOf("/");
String decodeurl = url.substring(start, end);
return decodeurl;
}
}
本文注意:此文章纯为了博主自己学习使用,如有侵权,请联系我,我会立马下架
联系方式:QQ:1258904360
上一篇: 添加billboard图片和gif标点
下一篇: 这猪死得有点冤