欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

使用JAXP对xml文档进行DOM解析基础

程序员文章站 2022-05-29 12:56:24
XML解析方式分为两种:dom和sax dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。 sax: (Simple API for XML) 不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。 ......

 

  • xml解析方式分为两种:dom和sax

        dom:(document object model, 即文档对象模型) 是 w3c 组织推荐的处理 xml 的一种方式。
       sax: (simple api for xml) 不是官方标准,但它是 xml 社区事实上的标准,几乎所有的 xml 解析器都支持它。

  • xml解析器

       crimson、xerces 、aelfred2

  • xml解析开发包

       jaxp、jdom、dom4j

 

  • jaxp 开发包是j2se的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成
  • 在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 dom 或 sax 的解析器对象。

 

  • dom模型(document object model)

dom解析器在解析xml文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个node对象(节点)。
在dom中,节点之间关系如下:

  • 位于一个节点之上的节点是该节点的父节点(parent)
  • 一个节点之下的节点是该节点的子节点(children)
  • 同一层次,具有相同父节点的节点是兄弟节点(sibling)
  • 一个节点的下一个层次的节点集合是节点后代(descendant)
  • 父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)

 

  • javax.xml.parsers 包中的documentbuilderfactory用于创建dom模式的解析器对象 ,

documentbuilderfactory是一个抽象工厂类,它不能直接实例化,

但该类提供了一个newinstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

 

 

 

1.调用 documentbuilderfactory.newinstance() 方法得到创建 dom 解析器的工厂对象。       

 documentbuilderfactory factory = documentbuilderfactory.newinstance();

2.调用工厂对象的 newdocumentbuilder方法得到 dom 解析器对象。

 documentbuilder builder = factory.newdocumentbuilder();

3.调用 dom 解析器对象的 parse() 方法解析 xml 文档,得到代表整个文档的 document 对象,进行可以利用dom特性对整个xml文档进行操作了。

 documentbuilder builder = factory.newdocumentbuilder();

 

 

  • node对象提供了一系列常量来代表结点的类型,当开发人员获得某个node类型后,就可以把node节点转换成相应的节点对象(node的子类对象),以便于调用其特有的方法。(查看api文档)
  • node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个xml文档的内容、或添加、修改、删除xml文档的内容了。(如果node对象没有对应的方法可以强制转换为element等对象进行操作)

 

  • javax.xml.transform包中的transformer类用于把代表xml文件的document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把document对象又重新写入到一个xml文件中。
  • transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:
      • transform(source xmlsource, result outputtarget)
      •   javax.xml.transform.dom.domsource类来关联要转换的document对象,
      •   用javax.xml.transform.stream.streamresult 对象来表示数据的目的地。

 

  • transformer对象通过transformerfactory获得。

 

 book1.xml:

<?xml version="1.0" encoding="utf-8" standalone="no"?>
<书架>
    <书 name="xxxx">
        <售价>55元</售价>
        <书名>java就业培训教程</书名>
        <作者>张孝祥</作者>
    </书>
    <书>
        <书名>javascript网页开发</书名>
        <作者>张孝祥</作者>
        <售价>28.00元</售价>
    </书>
</书架>

 

 demo1.java:

package wys.jaxp;

import java.io.file;
import javax.xml.parsers.documentbuilder;
import javax.xml.parsers.documentbuilderfactory;
import javax.xml.transform.transformer;
import javax.xml.transform.transformerfactory;
import javax.xml.transform.dom.domsource;
import javax.xml.transform.stream.streamresult;
import org.junit.test;
import org.w3c.dom.document;
import org.w3c.dom.element;
import org.w3c.dom.node;
import org.w3c.dom.nodelist;

public class demo1 {

    public static void main(string[] args) throws exception {

        // 获取工厂
        documentbuilderfactory factory = documentbuilderfactory.newinstance();

        // 产生解析器
        documentbuilder builder = factory.newdocumentbuilder();

        // 解析xml文档,获取代表文档的document
        document document = builder.parse(new file("src/xml/book1.xml"));

        read(document);

    }

    // 读取指定节点值
    public static void read(document document) {
        nodelist nodelist = document.getelementsbytagname("售价");

        node node = nodelist.item(0);

        string val = node.gettextcontent();

        system.out.println(val);

    }

    // 更新节点内容
    public static void update() throws exception {
        documentbuilderfactory factory = documentbuilderfactory.newinstance();

        documentbuilder builder = factory.newdocumentbuilder();

        document document = builder.parse(new file("src/xml/book1.xml"));

        // 获取售价节点
        node price = document.getelementsbytagname("售价").item(0);
        price.settextcontent("5555元");

        transformerfactory tfactory = transformerfactory.newinstance();
        transformer tformer = tfactory.newtransformer();

        tformer.transform(new domsource(document), new streamresult(new file(
                "src/xml/book1.xml")));

    }

    // 向指定节点中增加子节点
    public static void add() throws exception {

        documentbuilderfactory factory = documentbuilderfactory.newinstance();

        documentbuilder builder = factory.newdocumentbuilder();

        document document = builder.parse(new file("src/xml/book1.xml"));

        // 创建一个售价节点在内存中
        node price = document.createelement("售价");
        price.settextcontent("1888元");

        // 获取要加入位置的父节点
        node shu = document.getelementsbytagname("书").item(0);

        // 把需要增加的节点挂到父节点上
        shu.appendchild(price);

        // 将内存中的document写入xml文件,先用转换工厂得到转换器
        transformerfactory tf = transformerfactory.newinstance();
        transformer transformer = tf.newtransformer();

        transformer.transform(new domsource(document), new streamresult(
                new file("src/xml/book1.xml")));
    }

    //向指定位置插入新的节点
    @test
    public void add2() throws exception {

        documentbuilderfactory factory = documentbuilderfactory.newinstance();

        documentbuilder builder = factory.newdocumentbuilder();

        document document = builder.parse(new file("src/xml/book1.xml"));

        node price = document.createelement("售价");
        price.settextcontent("指定位置:16元");

        // 向指定节点之前插入新节点
        node shu = document.getelementsbytagname("书").item(0);
        shu.insertbefore(price, document.getelementsbytagname("书名").item(0));

        // 将内存中的document写入xml文件,先用转换工厂得到转换器
        transformerfactory tf = transformerfactory.newinstance();
        transformer transformer = tf.newtransformer();

        transformer.transform(new domsource(document), new streamresult(
                new file("src/xml/book1.xml")));

    }

    
    @test
    //删除指定节点
    public void delete() throws exception {

        documentbuilderfactory factory = documentbuilderfactory.newinstance();
        documentbuilder builder = factory.newdocumentbuilder();
        document document = builder.parse(new file("src/xml/book1.xml"));

        // 获取要删除的节点,调用父节点删除(自己不能删除自己)
        node price = document.getelementsbytagname("售价").item(2);
        price.getparentnode().removechild(price);

        transformerfactory tf = transformerfactory.newinstance();
        transformer transformer = tf.newtransformer();
        transformer.transform(new domsource(document), new streamresult(
                new file("src/xml/book1.xml")));
    }

    
    
    // 操作xml文档属性
    @test
    public void updateattribute() throws exception {

        documentbuilderfactory factory = documentbuilderfactory.newinstance();
        documentbuilder builder = factory.newdocumentbuilder();
        document document = builder.parse(new file("src/xml/book1.xml"));

        // element继承自node,node没有操作属性的方法,操作节点属性需要强制转换为元素节点
        element shu = (element) document.getelementsbytagname("书").item(0);
        shu.setattribute("name", "yyyyyyy");
        shu.setattribute("password", "12345678");
        shu.removeattribute("password");

        transformerfactory tf = transformerfactory.newinstance();
        transformer transformer = tf.newtransformer();
        transformer.transform(new domsource(document), new streamresult(
                new file("src/xml/book1.xml")));

    }

}