欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Jaxp中使用dom方式解析xml文档

程序员文章站 2022-05-28 14:46:40
...
xml的解析:xml是标记型语言
xml的解析方法:dom和sax


使用dom和sax解析xml的解析过程:


dom解析分析:根据xml的层级结构,在内存中分配一个树形结构,把xml中的标签、属性和文本都封装成对象。


优点:对于增删改操作很方便。
缺点:如果xml文件过大,会造成文件的溢出。


sax解析分析:采用事件驱动,边读边解析
从上到下,一行一行的解析,解析到某个对象,把对象名称返回。


优点:不会造成内存溢出,实现查询

缺点:不能实现增删改操作

xml示例:

<?xml version="1.0" encoding="UTF-8" standalone="no"?><person>
	<student>
		<name>张三</name>
		<age>19</age>
	</student>
	<student>
		<name>李四</name>
		<age>20</age>
	</student>
</person>

jaxp解析程序

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.ErrorListener;
import javax.xml.transform.Source;
import javax.xml.transform.Templates;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.URIResolver;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;

/**
 * 解析xml
 * 
 * @author My World
 *
 */
public class Jaxp_Person {

	public static void main(String[] args) throws Exception {
		listElement(); //遍历每一个节点
		//deleteSex();// 删除sex节点
		// updataSex();// 修改sex节点
		// addSex();//增加节点
		// selectSingle();//查询指定的第一个节点
		// selectAll();//查询所有节点
	}

	private static void listElement() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		//4、遍历节点,先获取子节点,通过子节点获取根节点
		//可以通过遍历实现
		list(document);
	}

	//递归遍历的方法
	private static void list(Node node) {
		//判断是否是Element,如果是就打印
		if (node.getNodeType() == node.ELEMENT_NODE) {
			System.out.println(node.getNodeName());
		}
		//得到一层子节点
		NodeList list = node.getChildNodes();
		for(int i = 0;i < list.getLength();i++){
			//得到每一个节点
			Node node1 = list.item(i);
			list(node1);
		}
		
	}

	private static void deleteSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到sex
		Node sex = document.getElementsByTagName("sex").item(0);
		Node student = sex.getParentNode();
		student.removeChild(sex);
		// 6、回写下xml
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
	}

	/**
	 * 修改第一个student中的sex的值
	 * 
	 * @throws Exception
	 */
	private static void updataSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到sex
		Node sex = document.getElementsByTagName("sex").item(0);
		// 修改sex的值
		sex.setTextContent("男");
		// 6、回写下xml
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));

	}

	/**
	 * 增加一个sex节点
	 * 
	 * @throws Exception
	 */
	private static void addSex() throws Exception {
		// 1、创建解析器工厂
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		// 2、通过解析器工厂,创建解析器
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		// 3、解析xml文档,返回Document
		Document document = builder.parse("src/analysis/Person.xml");
		// 4、得到student集合
		NodeList nodeList = document.getElementsByTagName("student");
		// 得到第一个student节点
		Node student = nodeList.item(0);
		// 创建sex标签
		Element sex = document.createElement("sex");
		// 创建标签文本
		Text text = document.createTextNode("女");
		// 把标签的文本添加到标签上
		sex.appendChild(text);
		// 把sex标签放入student节点上
		student.appendChild(sex);

		// 会写xml(很重要),上面虽然已经把sex标签添加进student节点了,但是那只是内存中的,xml文档中并没有改变
		// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
		TransformerFactory transformerFactory = TransformerFactory.newInstance();
		// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
		Transformer transformer = transformerFactory.newTransformer();
		// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
		transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
	}

	/**
	 * 查询第一个student的name
	 * 
	 * @throws Exception
	 */
	private static void selectSingle() throws Exception {
		/**
		 * 1、创建解析器工厂 2、通过解析器工厂,创建解析器 3、解析xml文档,返回Document
		 */
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		Document document = builder.parse("src/analysis/Person.xml");
		// 得到所有name的值,并使用item(0),获取NodeList集合中
		Node name = document.getElementsByTagName("name").item(0);
		String string = name.getTextContent();// 获取name节点具体的值
		System.out.println(string);
	}

	/**
	 * 查询所有
	 * 
	 * @throws Exception
	 */
	private static void selectAll() throws Exception {
		/**
		 * 1、创建解析器工厂 DocumentBuilderFactory是一个抽象类,不能直接new,可以使用newInstance方法,
		 * 返回一个DocumentBuilderFactory对象
		 */
		DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
		/**
		 * 2、创建解析器 BuilderFactory解析器是一个抽象类,通过解析器工厂的newDocumentBuilder()创建解析器类
		 */
		DocumentBuilder builder = builderFactory.newDocumentBuilder();
		/**
		 * 3、解析xml返回Document
		 */
		Document document = builder.parse("src/analysis/Person.xml");
		/**
		 * 4、得到所有的name元素,通过getElementByTagName获取标签,与html相同
		 */
		NodeList nodeList = document.getElementsByTagName("name");
		/**
		 * 5、遍历NodeList集合
		 */
		for (int i = 0; i < nodeList.getLength(); i++) {
			// 得到node节点
			Node name = nodeList.item(i);
			System.out.println(name);
			// 通过getTextContent()方法得到node里面的文本内容
			System.out.println(name.getTextContent());
		}
	}
}


相关标签: xml jaxp dom