Jaxp中使用dom方式解析xml文档

程序员文章站 2022-05-28 14:46:40

...

xml的解析：xml是标记型语言
xml的解析方法：dom和sax

使用dom和sax解析xml的解析过程：

dom解析分析:根据xml的层级结构，在内存中分配一个树形结构,把xml中的标签、属性和文本都封装成对象。

优点：对于增删改操作很方便。
缺点：如果xml文件过大,会造成文件的溢出。

sax解析分析:采用事件驱动，边读边解析
从上到下,一行一行的解析,解析到某个对象,把对象名称返回。

优点:不会造成内存溢出,实现查询

缺点:不能实现增删改操作

xml示例：

<?xml version="1.0" encoding="UTF-8" standalone="no"?><person>
	<student>
		<name>张三</name>
		<age>19</age>
	</student>
	<student>
		<name>李四</name>
		<age>20</age>
	</student>
</person>

jaxp解析程序

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.ErrorListener;
import javax.xml.transform.Source;
import javax.xml.transform.Templates;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.URIResolver;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;

/**
 * 解析xml
 * 
 * @author My World
 *
 */
public class Jaxp_Person {

	public static void main(String[] args) throws Exception {
		listElement(); //遍历每一个节点
		//deleteSex();// 删除sex节点
		// updataSex();// 修改sex节点
		// addSex();//增加节点
		// selectSingle();//查询指定的第一个节点
		// selectAll();//查询所有节点
	}

	private static void listElement() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		//4、遍历节点,先获取子节点,通过子节点获取根节点
		//可以通过遍历实现
		list(document);
	}

	//递归遍历的方法
	private static void list(Node node) {
		//判断是否是Element,如果是就打印
		if (node.getNodeType() == node.ELEMENT_NODE) {
			System.out.println(node.getNodeName());
		}
		//得到一层子节点
		NodeList list = node.getChildNodes();
		for(int i = 0;i < list.getLength();i++){
			//得到每一个节点
			Node node1 = list.item(i);
			list(node1);
		}
		
	}

	private static void deleteSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到sex
		Node sex = document.getElementsByTagName("sex").item(0);
		Node student = sex.getParentNode();
		student.removeChild(sex);
		// 6、回写下xml
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
	}

	/**
	 * 修改第一个student中的sex的值
	 * 
	 * @throws Exception
	 */
	private static void updataSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到sex
		Node sex = document.getElementsByTagName("sex").item(0);
		// 修改sex的值
		sex.setTextContent("男");
		// 6、回写下xml
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));

	}

	/**
	 * 增加一个sex节点
	 * 
	 * @throws Exception
	 */
	private static void addSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到student集合
		NodeList nodeList = document.getElementsByTagName("student");
		// 得到第一个student节点
		Node student = nodeList.item(0);
		// 创建sex标签
		Element sex = document.createElement("sex");
		// 创建标签文本
		Text text = document.createTextNode("女");
		// 把标签的文本添加到标签上
		sex.appendChild(text);
		// 把sex标签放入student节点上
		student.appendChild(sex);

		// 会写xml(很重要),上面虽然已经把sex标签添加进student节点了,但是那只是内存中的,xml文档中并没有改变
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
	}

	/**
	 * 查询第一个student的name
	 * 
	 * @throws Exception
	 */
	private static void selectSingle() throws Exception {
		/**
		 * 1、创建解析器工厂 2、通过解析器工厂,创建解析器 3、解析xml文档,返回Document
		 */
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("src/analysis/Person.xml");
		// 得到所有name的值,并使用item(0),获取NodeList集合中
		Node name = document.getElementsByTagName("name").item(0);
		String string = name.getTextContent();// 获取name节点具体的值
		System.out.println(string);
	}

	/**
	 * 查询所有
	 * 
	 * @throws Exception
	 */
	private static void selectAll() throws Exception {
		/**
		 * 1、创建解析器工厂 DocumentBuilderFactory是一个抽象类,不能直接new,可以使用newInstance方法,
		 * 返回一个DocumentBuilderFactory对象
		 */
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		/**
		 * 2、创建解析器 BuilderFactory解析器是一个抽象类,通过解析器工厂的newDocumentBuilder()创建解析器类
		 */
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		/**
		 * 3、解析xml返回Document
		 */
		Document document = builder.parse("src/analysis/Person.xml");
		/**
		 * 4、得到所有的name元素,通过getElementByTagName获取标签,与html相同
		 */
		NodeList nodeList = document.getElementsByTagName("name");
		/**
		 * 5、遍历NodeList集合
		 */
		for (int i = 0; i < nodeList.getLength(); i++) {
			// 得到node节点
			Node name = nodeList.item(i);
			System.out.println(name);
			// 通过getTextContent()方法得到node里面的文本内容
			System.out.println(name.getTextContent());
		}
	}
}

Jaxp中使用dom方式解析xml文档

java使用dom4j生成与解析xml文档的方法示例

Java使用dom方式解析和操作xml，递归解析xml以yml格式输出

使用DOM解析XML文档

Java中的XML之四种方式解析XML文档：DOM，SAX，JDOM，DOM4J

XML使用DOM方式解析

使用JAXP对xml文档进行DOM解析基础

Java中使用DOM方式解析和创建XML文档、及dom4j使用简介

使用SAX和dom4j解析XML文档

使用DOM4J和XPath两种方式分别解析XML

DOM4J使用XPath解析含有xmlns的xml文档