使用DOM4J和xpath解析XML（一）

程序员文章站 2022-03-03 16:13:36

...

books.xml:


<?xml version="1.0" encoding="UTF-8"?>
<books>
    <!--This is a test for dom4j, jakoes, 2007.7.19-->
    <book show="yes" url="lucene.net">
        <title id="456">Lucene Studing</title>
    </book>
    <book show="yes" url="dom4j.com">
        <title id="123">Dom4j Tutorials</title>
    </book>
    <book show="no" url="spring.org">
        <title id="789">Spring in Action</title>
    </book>
    <owner>O'Reilly</owner>
</books>

下面我们使用dom4j的xPath来解析：


public void parseBooks(){   

        SAXReader reader = new SAXReader();   
        try {   
            Document doc = reader.read("books.xml");   
            Node root = doc.selectSingleNode("/books");   
            List list = root.selectNodes("book[@url='dom4j.com']");   

            for(Object o:list){   

                Element e = (Element) o;   
                String show=e.attributeValue("show");   
                System.out.println("show = " + show);   
            }   

        } catch (Exception e) {   
            e.printStackTrace();   
        }   
    }  

public void parseBooks(){

        SAXReader reader = new SAXReader();
        try {
            Document doc = reader.read("books.xml");
            Node root = doc.selectSingleNode("/books");
            List list = root.selectNodes("book[@url='dom4j.com']");

            for(Object o:list){

                Element e = (Element) o;
                String show=e.attributeValue("show");
                System.out.println("show = " + show);
            }

        } catch (Exception e) {
            e.printStackTrace();
        }
    }

Document doc = reader.read("books.xml");的意思是加载XML文档，此是可以用
doc.asXML()来查看，它将打印整个xml文档。

Node root = doc.selectSingleNode("/books");是读取刚才加载的xml文档内的books节点下的所有内容，对于本例也是整个xml文档。
当然我们也可以加载/books下的某一个节点，如：book节点
Node root = doc.selectSingleNode("/books/book");
或：Node root = doc.selectSingleNode("/books/*");
注意：如果有多个book节点，它只会读取第一个
root.asXML()将打印：
<book show="yes" url="lucene.net">
<title id="456">Lucene Studing</title>
</book>

既然加载了这么多，那我怎么精确的得到我想要的节点呢，别急，看下面：
List list = root.selectNodes("book[@url='dom4j.com']");
它的意思就是读取books节点下的book节点，且book的节点的url属性为dom4j.com
为什么使用list来接收呢，如果有两个book节点，且它们的url属性都为dom4j.com，此时就封闭到list里了。

如果想读取books下的所有book节点，可以这样：
List list = root.selectNodes("book");

如果想读取books节点下的book节点下的title节点，可以这样：
List list2 = root.selectNodes("book[@url='dom4j.com']/title[@id='123']");

注意：selectNodes()参数的格式：
节点名[@属性名='属性值']，如：book[@url='dom4j.com']
如果有多个节点，用“/”分开，如：book[@url='dom4j.com']/title[@id='123']

最近就是读取封闭在List里的内容了，可以用Node来读取，也可以用Element来转换。
attributeValue("属性")是读取该节点的属性值
getText()是读取节点的的内容。

使用DOM4J和xpath解析XML（一）

java使用dom4j生成与解析xml文档的方法示例

网页解析 -- bs4 和 xpath 的简单使用

Android ABC Jetpack学习之一文学会Navigation(附源码解析和使用封装)

java基础 xml 使用dom4j解析 xml文件 servlet根据pattern 找到class

Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常

Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常

Java程序员从笨鸟到菜鸟之（二十七）XML之Jdom和DOM4J解析 .

Java基础之XML介绍与SAX解析、DOM解析XML、JDOM解析、DOM4J解析、XMLEncoder与XMLDecoder的使用以及xstream工具的使用 189~195

【XML解析】使用Dom4j对XML进行SAX解析

Perl中使用dig和nali判断DNS解析地址归属地是否一致脚本分享