欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

XML解析之DOM解析

程序员文章站 2022-05-29 08:19:59
...

本文是自己在学习解析XML过程中的笔记,发布在这里是为了以后更好的改进和深入学习,同时也希望能够帮助到有需要的同学
DOM解析XML时DOM分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。而且,对于结构复杂的树的遍历也是一项耗时的操作。所以,DOM分析器对机器性能的要求比较高,实现效率不十分理想。不过,由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,解析过程中,树结构保存在内存中,方便修改。因此,DOM分析器还是有很广泛的使用价值的。注意:如果XML文件比较大,容易影响解析性能且可能会造成内存溢出。
XML如下

<?xml version="1.0"?>
<bookstore>
<book id="1">
<name>HELLO</name>
<author>ZHANGSAN</author>
<year>2017</year>
<price>100.00</price>
</book>
<book id="1">
<name>WORLD</name>
<author>LISI</author>
<year>2016</year>
<price>111.00</price>
</book>
<book id="3">
<name>DOM</name>
<author>WANGWU</author>
<year>2016</year>
<price>121.00</price>
</book>
<book id="4">
<name>XML</name>
<author>ZHAOLIU</author>
<year>2015</year>
<price>110.00</price>
</book>
</bookstore>

用DOM方式解析XML
解析思路大致如下:
1.读取XML文件
2.获取文件中的书的个数
3.获取每本书的属性
4.获取每本书的子节点
5.获取子节点的名和值

package com.zhang.dmtest.domtest;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.dom4j.Node;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DOMTest11 {

	public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
		// TODO Auto-generated method stub

		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		DocumentBuilder db = dbf.newDocumentBuilder();
		Document document = db.parse("book01.xml");
		
		//获取书 的本数Nodelist  ->   getElementByTagName("name")方法
		NodeList nodelist = document.getElementsByTagName("book");
		System.out.println("一共有" + nodelist.getLength() + "本书");
		
		for(int i = 0; i < nodelist.getLength(); i++) {
			System.out.println("-----开始遍历第" + (i + 1) + "本书-----");
			
			//获取第 i 本书的属性个数 NamedNodeMap   ->  getAttributes()方法
			NamedNodeMap attrs = nodelist.item(i).getAttributes();
			System.out.println("第" + (i + 1) + "本书共有" + attrs.getLength() + "个属性");
			for(int j = 0; j < attrs.getLength(); j++) {
				System.out.println("属性名为:" + attrs.item(j).getNodeName() + "   " + 
			"属性值为:" + attrs.item(j).getNodeValue());
			}
			//遍历第 i 本书的子节点
			NodeList booklist = nodelist.item(i).getChildNodes();
			System.out.println("第" + (i + 1) + "本书共有" + booklist.getLength() + "个子节点");
			for(int j = 0; j < booklist.getLength(); j++) {
				if(booklist.item(j).getNodeType() == Node.ELEMENT_NODE) {//判断子节点是elementl类型还是text类型
					System.out.println("第" + (j + 1) + "个子节点名为:" + 
				booklist.item(j).getNodeName() + "   子节点值为:" + booklist.item(j).getFirstChild().getNodeValue());
				}
			}
			
		}
	}

}
相关标签: DOM解析XML