欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

htmlunit 简单使用

程序员文章站 2022-05-05 12:32:38
...
遇到问题
htmlunit 使用
  • 请求 web 页面
WebClient webClient = new WebClient();
// 启动 js 解释器
webClient.getOptions().setJavaScriptEnabled(true);
// 禁用 css 支持
webClient.getOptions().setCssEnabled(false);
HtmlPage page = weClient.getPage("http://www.baidu.com");
  • 解析获取的响应文本
// 以 xml 的形式获取响应文本
String pageXml = page.asXml();
// 以 文本 的形式获取响应文本
String pageText = page.asText();
// 获取当前 Url (跳转后的最终Url)
String url = page.getUrl();
关于关闭警告日志和异常日志
  • 关掉所有警告日志和异常日志
LogFactory.getFactory().setAttribute("org.apache.commons.logging.Log", "org.apache.commons.logging.impl.NoOpLog");
java.util.logging.Logger.getLogger("com.gargoylesoftware.htmlunit").setLevel(Level.OFF);
java.util.logging.Logger.getLogger("org.apache.commons.httpclient").setLevel(Level.OFF);