java解析xml

程序员文章站 2022-07-12 13:29:45

...

XML 指可扩展标记语言XML ,被设计用来传输和存储数据。从某种角度来说，XML是数据封装和消息传递技术。许多框架的配置文件都是使用XML，所以有必要学习XML。

java的XML解析主要有两种方式：DOM和SAX。

1.DOM解析XML

DOM与语言平台无关，将XML文档建立一个完整的文档树，在内存中解析和存储XML文档，允许随机访问文档的不同部分。

优点：由于整棵树在内存中，因此可以对xml文档进行随机访问；可以对xml文档进行修改操作，API使用起来比较简单。

缺点：整个文档都需要载入内存，对于大文档成本高

我们这里说的是java自带的DOM解析方式,不使用第三方类库，DOM解析方式还有两种比较有名的解析方式JDOM和dom4j（dom4j使用最多,需要引入第三方类库，详情地址）

要解析的XML文档如下：

<?xml version="1.0" encoding="UTF-8"?>
<Teachers>
	<teacher id="1001">
		<name>黄小米</name>
		<age>28</age>
		<sex>男</sex>
	</teacher>
	<teacher id="1002">
		<name>李小璐</name>
		<age>30</age>
		<sex>女</sex>
	</teacher>
	<teacher id="1003">
		<name>王尼玛</name>
		<age>38</age>
		<sex>男</sex>
	</teacher>
</Teachers>

使用DOM解析代码及注释：

package Myclass;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Test {
		
	public static void main(String[] args) throws Exception{
		//创建dom解析器工厂
		DocumentBuilderFactory  df=DocumentBuilderFactory.newInstance();
		//生成解析器
		DocumentBuilder builder=df.newDocumentBuilder();
		//返回Document对象,准备解析
		Document doc=builder.parse(new File("F:\\NewFile.xml"));
		//根据结点获取数据
		NodeList teachers=doc.getElementsByTagName("teacher");
		//依次读取结点数据
		for(int i=0;i<teachers.getLength();i++)
		{
			//获取结点
			Node teacher=teachers.item(i);
			//获取老师id
			String id=teacher.getAttributes().getNamedItem("id").getNodeValue();
			System.out.print("老师编号："+id);
			//获取该结点的所有子结点
			NodeList son=teacher.getChildNodes();
			//输出子结点的数据
			for(int j=0;j<son.getLength();j++)
			{
				//获取结点
				Node ok=son.item(j);
				//获取结点名
				String name=ok.getNodeName();
				//输出老师名字
				if(name.equals("name"))
					System.out.print("  姓名："+ok.getFirstChild().getNodeValue());
				//输出老师年龄
				if(name.equals("age"))
					System.out.print("  年龄："+ok.getFirstChild().getNodeValue());
				//输出老师性别
				if(name.equals("sex"))
					System.out.print("  性别："+ok.getFirstChild().getNodeValue()+"\n");
			}
		}
		
	}
	
}

运行结果：

java解析xml

博客分类： XML javaxmlDOMSAXjava解析xml

2.SAX解析XML

SAX，全称Simple API for XML，既是一种接口，也是一种软件包。它是一种XML解析的替代方法。SAX不同于DOM解析，它逐行扫描文档，一边扫描一边解析。由于应用程序只是在读取数据时检查数据，因此不需要将数据存储在内存中，这对于大型文档的解析是个巨大优势。SAX是一个用于处理XML事件驱动的“推”模型。

特点：只能顺序读取文档，使用的是事件处理机制。内存占用少，不能随机读取。

解析XML代码和注解：

1.根据xml自定义Teacher类

package Myclass;

public class Teacher {
	public String id;
	
	public String  age;
	
	public String sex;

	public String name;
	
}

2.实现事件处理器，继承DefaultHandler类（解析重点难点，基于事件处理）

package Myclass;

import java.util.ArrayList;
import java.util.List;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class TeacherHandler extends DefaultHandler {

	public List<Teacher> teachers;

	public Teacher temp;

	public String tag;

	// 开始解析xml触发
	@Override
	public void startDocument() throws SAXException {
		// 实例化teachers
		teachers = new ArrayList<Teacher>();
	}

	// 解析完成时调用
	@Override
	public void endDocument() throws SAXException {
		super.endDocument();
		System.out.println("解析完成");
	}

	// 解析开始元素时调用,即<xx>,如<teacher>,<name>
	@Override
	public void startElement(String uri, String localName, String qName,
			Attributes attributes) throws SAXException {
		// 获取老师id
		if (qName.equals("teacher"))// 读取到<teacher>
		{
			// 实例化Teacher,存储Teacher结点的数据
			temp = new Teacher();
			// 获取老师id
			temp.id = attributes.getValue("id");
		}
		// 设置标记
		tag = qName;
	}

	// 解析文本内容时触发--需要注意xml里的空格和换行也会触发，此时需要标记tag
	@Override
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		super.characters(ch, start, length);
		if (tag != null) {
			if (tag.equals("name"))
				temp.name = new String(ch, start, length);
			if (tag.equals("age"))
				temp.age = new String(ch, start, length);
			if (tag.equals("sex"))
				temp.sex = new String(ch, start, length);
		}
	}

	// 解析结束元素时调用，即</xx>,如</teacher>,</name>
	@Override
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		super.endElement(uri, localName, qName);
		// 读取完一个teacher结点把数据添加到List里
		if (qName.equals("teacher"))
			teachers.add(temp);
		//清除标记
		tag=null;
	}
	
	//返回解析的List数据
	public List<Teacher> getTeachers()
	{
		return teachers;
	}
}

3.实现SAX解析

package Myclass;

import java.io.File;
import java.util.List;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class SAX {

	public static void main(String[] args)throws Exception {
		//创建SAX解析工厂
		SAXParserFactory factory=SAXParserFactory.newInstance();
		//创建解析对象
		SAXParser sax=factory.newSAXParser();
		//创建时间处理器
		TeacherHandler handler=new TeacherHandler();
		//开始解析
		sax.parse(new File("F:\\NewFile.xml"), handler);
		
		List<Teacher>data=handler.getTeachers();
		//输出结果
		for(int i=0;i<data.size();i++)
		{
			Teacher ok=data.get(i);
			System.out.println("老师编号："+ok.id+"  姓名："+ok.name+"  年龄："+ok.age+"  性别 ："+ok.sex);
		}
	}

}

运行结果：

java解析xml

博客分类： XML javaxmlDOMSAXjava解析xml