【Jsoup学习礼记】解析一个HTML字符串_html/css_WEB-ITnose
程序员文章站
2022-05-08 16:49:25
...
存在问题
来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。怎么办?jsonu能够帮你轻松解决这些问题
解决方法
使用静态Jsoup.parse(String html) 方法或 Jsoup.parse(String html, String baseUri)示例代码:
String html = "First parse " + "Parsed HTML into a doc.
";Document doc = Jsoup.parse(html);
描述
parse(String html, String baseUri) 这方法能够将输入的HTML解析为一个新的文档 (Document),参数 baseUri 是用来将相对 URL 转成绝对URL,并指定从哪个网站获取文档。如这个方法不适用,你可以使用 parse(String html) 方法来解析成HTML字符串如上面的示例。.
只要解析的不是空字符串,就能返回一个结构合理的文档,其中包含(至少) 一个head和一个body元素。
一旦拥有了一个Document,你就可以使用Document中适当的方法或它父类 Element和Node中的方法来取得相关数据。
推荐阅读
-
jsoup官方解析和遍历一个HTML文档
-
Jsoup-1.6.0的一个bug—解析html标签内容只是0被忽略掉了
-
Jsoup-1.6.0的一个bug—解析html标签内容只是0被忽略掉了
-
jsoup解析HTML_html/css_WEB-ITnose
-
学习笔记:发现一个IE版本判断的好方法_html/css_WEB-ITnose
-
因为业务需要,用nodejs写了一个css解析器,因为是基础库,想开源,不知道有没有人需要。_html/css_WEB-ITnose
-
Atitit.html解析器的选型?jsoup?nsoup?,java?c#?.net?版本_html/css_WEB-ITnose
-
【jsoup的学习礼记】设置一个元素的HTML内容_html/css_WEB-ITnose
-
用一个例子学习CSS的伪类元素_html/css_WEB-ITnose
-
HTML学习笔记实例-创建一个注册页面select两个option出来结果却是四个选项,其中两个空白选项的原因?_html/css_WEB-ITnose