欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

使用 dom4j 解析 XML

程序员文章站 2022-05-28 21:09:29
...
dom4j 是一种解析 XML 文档的开放源代码 XML 框架。本文介绍如何使用包含在 dom4j 中的解析器创建并修改 XML 文档。

dom4j API 包含一个解析 XML 文档的工具。本文中将使用这个解析器创建一个示例 XML 文档。清单 1 显示了这个示例 XML 文档,catalog.xml。

使用 dom4j 解析 XML<?xml version="1.0" encoding="UTF-8"?> 
使用 dom4j 解析 XML
<catalog> 
使用 dom4j 解析 XML
<!--An XML Catalog--> 
使用 dom4j 解析 XML
<?target instruction?>
使用 dom4j 解析 XML    
<journal title="XML Zone" 
使用 dom4j 解析 XML                    publisher
="IBM developerWorks"> 
使用 dom4j 解析 XML
使用 dom4j 解析 XML
<article level="Intermediate" date="December-2001">
使用 dom4j 解析 XML 
<title>Java configuration with XML Schema</title> 
使用 dom4j 解析 XML 
<author> 
使用 dom4j 解析 XML       
<firstname>Marcello</firstname> 
使用 dom4j 解析 XML       
<lastname>Vitaletti</lastname> 
使用 dom4j 解析 XML 
</author>
使用 dom4j 解析 XML    
</article>
使用 dom4j 解析 XML    
</journal> 
使用 dom4j 解析 XML
</catalog>

 

然后使用同一个解析器修改 catalog.xml,清单 2 是修改后的 XML 文档,catalog-modified.xml。

使用 dom4j 解析 XML<?xml version="1.0" encoding="UTF-8"?> 
使用 dom4j 解析 XML
<catalog> 
使用 dom4j 解析 XML
<!--An XML catalog--> 
使用 dom4j 解析 XML
<?target instruction?>
使用 dom4j 解析 XML    
<journal title="XML Zone"
使用 dom4j 解析 XML                     publisher
="IBM developerWorks"> 
使用 dom4j 解析 XML
使用 dom4j 解析 XML
<article level="Introductory" date="October-2002">
使用 dom4j 解析 XML 
<title>Create flexible and extensible XML schemas</title> 
使用 dom4j 解析 XML 
<author> 
使用 dom4j 解析 XML       
<firstname>Ayesha</firstname> 
使用 dom4j 解析 XML       
<lastname>Malik</lastname> 
使用 dom4j 解析 XML 
</author> 
使用 dom4j 解析 XML    
</article>
使用 dom4j 解析 XML    
</journal> 
使用 dom4j 解析 XML
</catalog>

与 W3C DOM API 相比,使用 dom4j 所包含的解析器的好处是 dom4j 拥有本地的 XPath 支持。DOM 解析器不支持使用 XPath 选择节点。

本文包括以下几个部分:

  • 预先设置
  • 创建文档
  • 修改文档


这个解析器可以从 http://dom4j.org 获取。通过设置使 dom4j-1.4/dom4j-full.jar 能够在 classpath 中访问,该文件中包括 dom4j 类、XPath 引擎以及 SAX 和 DOM 接口。如果已经使用了 JAXP 解析器中包含的 SAX 和 DOM 接口,向 classpath 中增加 dom4j-1.4/dom4j.jardom4j.jar 包括 dom4j 类和 XPath 引擎,但是不含 SAX 与 DOM 接口。


本节讨论使用 dom4j API 创建 XML 文档的过程,并创建示例 XML 文档 catalog.xml。

使用 import 语句导入 dom4j API 类:


使用 DocumentHelper 类创建一个文档实例。DocumentHelper 是生成 XML 文档节点的 dom4j API 工厂类。

使用 addElement() 方法创建根元素 catalog addElement() 用于向 XML 文档中增加元素。

catalog 元素中使用 addComment() 方法添加注释“An XML catalog”。

catalog 元素中使用 addProcessingInstruction() 方法增加一个处理指令。

catalog 元素中使用 addElement() 方法增加 journal 元素。

使用 addAttribute() 方法向 journal 元素添加 titlepublisher 属性。

article 元素中添加 journal 元素。

article 元素增加 leveldate 属性。

article 元素中增加 title 元素。

使用 setText() 方法设置 article 元素的文本。

article 元素中增加 author 元素。

author 元素中增加 firstname 元素并设置该元素的文本。

author 元素中增加 lastname 元素并设置该元素的文本。

可以使用 addDocType() 方法添加文档类型说明。

这样就向 XML 文档中增加文档类型说明:

如果文档要使用文档类型定义(DTD)文档验证则必须有 Doctype。

XML 声明 <?xml version="1.0" encoding="UTF-8"?> 自动添加到 XML 文档中。

清单 3 所示的例子程序 XmlDom4J.java 用于创建 XML 文档 catalog.xml。

使用 dom4j 解析 XMLimport org.dom4j.Document;
使用 dom4j 解析 XML
import org.dom4j.DocumentHelper;
使用 dom4j 解析 XML
import org.dom4j.Element;
使用 dom4j 解析 XML
import org.dom4j.io.XMLWriter;
使用 dom4j 解析 XML
import java.io.*;
使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML
public class XmlDom4J...{
使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML
public void generateDocument()...{
使用 dom4j 解析 XMLDocument document 
= DocumentHelper.createDocument();
使用 dom4j 解析 XML       Element catalogElement 
= document.addElement("catalog");
使用 dom4j 解析 XML       catalogElement.addComment(
"An XML Catalog");
使用 dom4j 解析 XML       catalogElement.addProcessingInstruction(
"target","text");
使用 dom4j 解析 XML       Element journalElement 
=    catalogElement.addElement("journal");
使用 dom4j 解析 XML       journalElement.addAttribute(
"title""XML Zone");
使用 dom4j 解析 XML       journalElement.addAttribute(
"publisher""IBM developerWorks");
使用 dom4j 解析 XML
使用 dom4j 解析 XML       Element articleElement
=journalElement.addElement("article");
使用 dom4j 解析 XML       articleElement.addAttribute(
"level""Intermediate");
使用 dom4j 解析 XML       articleElement.addAttribute(
"date""December-2001");
使用 dom4j 解析 XML       Element    titleElement
=articleElement.addElement("title");
使用 dom4j 解析 XML       titleElement.setText(
"Java configuration with XML Schema");
使用 dom4j 解析 XML       Element authorElement
=articleElement.addElement("author");
使用 dom4j 解析 XML       Element    firstNameElement
=authorElement.addElement("firstname");
使用 dom4j 解析 XML       firstNameElement.setText(
"Marcello");
使用 dom4j 解析 XML       Element lastNameElement
=authorElement.addElement("lastname");
使用 dom4j 解析 XML       lastNameElement.setText(
"Vitaletti");
使用 dom4j 解析 XML
使用 dom4j 解析 XML       document.addDocType(
"catalog",
使用 dom4j 解析 XML                             
null,"file://c:/Dtds/catalog.dtd");
使用 dom4j 解析 XML使用 dom4j 解析 XML      
try...{
使用 dom4j 解析 XML      XMLWriter output 
= new XMLWriter(
使用 dom4j 解析 XML              
new FileWriter( new File("c:/catalog/catalog.xml") ));
使用 dom4j 解析 XML          output.write( document );
使用 dom4j 解析 XML          output.close();
使用 dom4j 解析 XML          }

使用 dom4j 解析 XML使用 dom4j 解析 XML       
catch(IOException e)...{System.out.println(e.getMessage());}
使用 dom4j 解析 XML}

使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML
public static void main(String[] argv)...{
使用 dom4j 解析 XMLXmlDom4J dom4j
=new XmlDom4J();
使用 dom4j 解析 XMLdom4j.generateDocument();
使用 dom4j 解析 XML}
}

使用 dom4j 解析 XML

 

这一节讨论了创建 XML 文档的过程,下一节将介绍使用 dom4j API 修改这里创建的 XML 文档。


这一节说明如何使用 dom4j API 修改示例 XML 文档 catalog.xml。

使用 SAXReader 解析 XML 文档 catalog.xml:

SAXReader 包含在 org.dom4j.io 包中。

inputXml 是从 c:/catalog/catalog.xml 创建的 java.io.File。使用 XPath 表达式从 article 元素中获得 level 节点列表。如果 level 属性值是“Intermediate”则改为“Introductory”。

获取 article 元素列表,从 article 元素中的 title 元素得到一个迭代器,并修改 title 元素的文本。

通过和 title 元素类似的过程修改 author 元素。

清单 4 所示的示例程序 Dom4JParser.java 用于把 catalog.xml 文档修改成 catalog-modified.xml 文档。

使用 dom4j 解析 XMLimport org.dom4j.Document;
使用 dom4j 解析 XML
import org.dom4j.Element;
使用 dom4j 解析 XML
import org.dom4j.Attribute;
使用 dom4j 解析 XML
import java.util.List;
使用 dom4j 解析 XML
import java.util.Iterator;
使用 dom4j 解析 XML
import org.dom4j.io.XMLWriter;
使用 dom4j 解析 XML
import java.io.*;
使用 dom4j 解析 XML
import org.dom4j.DocumentException;
使用 dom4j 解析 XML
import org.dom4j.io.SAXReader; 
使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML
public class Dom4JParser...{
使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML 
public void modifyDocument(File inputXml)...{
使用 dom4j 解析 XML
使用 dom4j 解析 XML使用 dom4j 解析 XML    
try...{
使用 dom4j 解析 XML     SAXReader saxReader 
= new SAXReader();
使用 dom4j 解析 XML     Document document 
= saxReader.read(inputXml);
使用 dom4j 解析 XML
使用 dom4j 解析 XML     List list 
= document.selectNodes("//article/@level" );
使用 dom4j 解析 XML     Iterator iter
=list.iterator();
使用 dom4j 解析 XML使用 dom4j 解析 XML     
while(iter.hasNext())...{
使用 dom4j 解析 XML      Attribute attribute
=(Attribute)iter.next();
使用 dom4j 解析 XML      
if(attribute.getValue().equals("Intermediate"))
使用 dom4j 解析 XML        attribute.setValue(
"Introductory"); 
使用 dom4j 解析 XML
使用 dom4j 解析 XML         }

使用 dom4j 解析 XML     
使用 dom4j 解析 XML     list 
= document.selectNodes("//article/@date" );
使用 dom4j 解析 XML     iter
=list.iterator();
使用 dom4j 解析 XML使用 dom4j 解析 XML     
while(iter.hasNext())...{
使用 dom4j 解析 XML      Attribute attribute
=(Attribute)iter.next();
使用 dom4j 解析 XML      
if(attribute.getValue().equals("December-2001"))
使用 dom4j 解析 XML        attribute.setValue(
"October-2002");
使用 dom4j 解析 XML
使用 dom4j 解析 XML         }

使用 dom4j 解析 XML
使用 dom4j 解析 XML     list 
= document.selectNodes("//article" );
使用 dom4j 解析 XML     iter
=list.iterator();
使用 dom4j 解析 XML使用 dom4j 解析 XML     
while(iter.hasNext())...{
使用 dom4j 解析 XML      Element element
=(Element)iter.next();
使用 dom4j 解析 XML      Iterator iterator
=element.elementIterator("title");
使用 dom4j 解析 XML使用 dom4j 解析 XML        
while(iterator.hasNext())...{
使用 dom4j 解析 XML          Element titleElement
=(Element)iterator.next();
使用 dom4j 解析 XML          
if(titleElement.getText().equals("Java configuration with XML
使用 dom4j 解析 XML

使用 dom4j 解析 XML        Schema
"))
使用 dom4j 解析 XML
          titleElement.setText("Create flexible and extensible XML schema");
使用 dom4j 解析 XML
相关标签: XML IBM 框架