XML解析之DOM解析
程序员文章站
2022-05-29 08:19:59
...
本文是自己在学习解析XML过程中的笔记,发布在这里是为了以后更好的改进和深入学习,同时也希望能够帮助到有需要的同学
DOM解析XML时DOM分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。而且,对于结构复杂的树的遍历也是一项耗时的操作。所以,DOM分析器对机器性能的要求比较高,实现效率不十分理想。不过,由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,解析过程中,树结构保存在内存中,方便修改。因此,DOM分析器还是有很广泛的使用价值的。注意:如果XML文件比较大,容易影响解析性能且可能会造成内存溢出。
XML如下
<?xml version="1.0"?>
<bookstore>
<book id="1">
<name>HELLO</name>
<author>ZHANGSAN</author>
<year>2017</year>
<price>100.00</price>
</book>
<book id="1">
<name>WORLD</name>
<author>LISI</author>
<year>2016</year>
<price>111.00</price>
</book>
<book id="3">
<name>DOM</name>
<author>WANGWU</author>
<year>2016</year>
<price>121.00</price>
</book>
<book id="4">
<name>XML</name>
<author>ZHAOLIU</author>
<year>2015</year>
<price>110.00</price>
</book>
</bookstore>
用DOM方式解析XML
解析思路大致如下:
1.读取XML文件
2.获取文件中的书的个数
3.获取每本书的属性
4.获取每本书的子节点
5.获取子节点的名和值
package com.zhang.dmtest.domtest;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.dom4j.Node;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DOMTest11 {
public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
// TODO Auto-generated method stub
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse("book01.xml");
//获取书 的本数Nodelist -> getElementByTagName("name")方法
NodeList nodelist = document.getElementsByTagName("book");
System.out.println("一共有" + nodelist.getLength() + "本书");
for(int i = 0; i < nodelist.getLength(); i++) {
System.out.println("-----开始遍历第" + (i + 1) + "本书-----");
//获取第 i 本书的属性个数 NamedNodeMap -> getAttributes()方法
NamedNodeMap attrs = nodelist.item(i).getAttributes();
System.out.println("第" + (i + 1) + "本书共有" + attrs.getLength() + "个属性");
for(int j = 0; j < attrs.getLength(); j++) {
System.out.println("属性名为:" + attrs.item(j).getNodeName() + " " +
"属性值为:" + attrs.item(j).getNodeValue());
}
//遍历第 i 本书的子节点
NodeList booklist = nodelist.item(i).getChildNodes();
System.out.println("第" + (i + 1) + "本书共有" + booklist.getLength() + "个子节点");
for(int j = 0; j < booklist.getLength(); j++) {
if(booklist.item(j).getNodeType() == Node.ELEMENT_NODE) {//判断子节点是elementl类型还是text类型
System.out.println("第" + (j + 1) + "个子节点名为:" +
booklist.item(j).getNodeName() + " 子节点值为:" + booklist.item(j).getFirstChild().getNodeValue());
}
}
}
}
}
上一篇: Anaconda虚拟环境下使用pip install失败
下一篇: [XML]Dom创建,解析xml