欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java使用SAX解析xml的示例

程序员文章站 2022-03-13 08:26:04
一、sax解析xml简介sax是simple api for xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的...

一、sax解析xml简介

sax是simple api for xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的优点,当然这些优点也仅限于xml的读取操作,sax是无法对读取的xml元素进行修改的。如果要修改节点元素则需要使用doc方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作;doc方式的缺点也比较明显:占内存大、解析速度较慢。

所以仅用于读取xml操作,使用sax方式是比较好的方式。

二、sax解析xml实例

创建一个解析的xml文件

<?xml version="1.0" encoding="utf-8"?>
<persons>
  <user>
    <userid>1001</userid>
    <username>张三</username>
  </user>
  <user>
    <userid>1002</userid>
    <username>李四</username>
  </user>
</persons>

创建一个xmlparsehandler用于自定义xml解析

public class customhandler extends defaulthandler2 {

  list<map> list = new arraylist<>();
  map map = null;
  string tag = "";

  @override
  public void startdocument() throws saxexception {
    system.out.println("开始解析xml");
  }

  @override
  public void startelement(string uri, string localname, string qname, attributes attributes) throws saxexception {
    system.out.println("开始解析元素: <"+ qname + ">");
    if(qname == "user"){
      map = new hashmap();
    }
    tag = qname;
  }

  @override
  public void characters(char[] ch, int start, int length) throws saxexception {
    string text = new string(ch, start, length).trim();
    if(text != null && !text.isempty() && tag!=null&& tag!=""){
      map.put(tag, text);
      if(!map.containskey(tag)){
      }
      system.out.println("解析到元素值:"+ text);
    }
  }

  @override
  public void endelement(string uri, string localname, string qname) throws saxexception {
    system.out.println("结束解析元素: <"+ qname + ">");
    if(qname.equals("user")){
      list.add(map);
    }
    tag = "";
  }

  @override
  public void enddocument() throws saxexception {
    system.out.println("结束解析xml");
  }
}

创建sax解析对象解析xml

public static void main(string[] args) throws parserconfigurationexception, saxexception, ioexception {
  //创建xml解析工厂
  saxparserfactory factory = saxparserfactory.newinstance();
  //创建xml解析对象
  saxparser parser = factory.newsaxparser();
  file file = new file("test/custom/user.xml");
  inputstream inputstream = new fileinputstream(file);
  customhandler customhandler = new customhandler();
  //方式一
  //parser.parse(inputstream, customhandler);

	//方式二
  inputsource source = new inputsource(file.touri().tourl().tostring());
  xmlreader xmlparser = parser.getxmlreader();
  xmlparser.setcontenthandler(customhandler);
  xmlparser.parse(source);
  list c = customhandler.list;
  inputstream.close();
}


//打印结果为:
开始解析xml
开始解析元素: <persons>
开始解析元素: <user>
开始解析元素: <userid>
解析到元素值:1001
结束解析元素: <userid>
开始解析元素: <username>
解析到元素值:张三
结束解析元素: <username>
结束解析元素: <user>
开始解析元素: <user>
开始解析元素: <userid>
解析到元素值:1002
结束解析元素: <userid>
开始解析元素: <username>
解析到元素值:李四
结束解析元素: <username>
结束解析元素: <user>
结束解析元素: <persons>
结束解析xml

三、sax的实际应用

在tomcat源码中,有一个digester对象,这个digester是tomcat启动时,初始化各个容器(service、engine、connetor)的执行者,而digester执行容器初始化的依据是解析配置文件server.xml的内容,根据xml的具体配置进行来初始化容器。

下面是digester的类的一些主要方法:

//org.apache.tomcat.util.digester.digester#parse(org.xml.sax.inputsource)
public class digester extends defaulthandler2 {
  
  //读取解析xml
  public object parse(inputsource input) throws ioexception, saxexception {
    configure();
    getxmlreader().parse(input);
    return root;
  }
  
  //对每个xml标签进行解析,并执行于之对应的rule规则列表
  public void startelement(string namespaceuri, string localname, string qname, attributes list)
    throws saxexception {
    boolean debug = log.isdebugenabled();
    // parse system properties
    list = updateattributes(list);
    // save the body text accumulated for our surrounding element
    bodytexts.push(bodytext);
    bodytext = new stringbuilder();
    // the actual element name is either in localname or qname, depending
    // on whether the parser is namespace aware
    string name = localname;
    if ((name == null) || (name.length() < 1)) {
      name = qname;
    }

    // compute the current matching rule
    stringbuilder sb = new stringbuilder(match);
    if (match.length() > 0) {
      sb.append('/');
    }
    sb.append(name); //根据每次xml节点的名称拼接成匹配url
    match = sb.tostring();

    // fire "begin" events for all relevant rules(根据namespaceuri匹配获取的rule规则列表,有顺序规则)
    list<rule> rules = getrules().match(namespaceuri, match);
    matches.push(rules);
    if ((rules != null) && (rules.size() > 0)) {
      for (rule value : rules) {
        try {
          rule rule = value;
          if (debug) {
            log.debug(" fire begin() for " + rule);
          }
          //依次执行begin方法
          rule.begin(namespaceuri, name, list);
        } catch (exception e) {
          log.error("begin event threw exception", e);
          throw createsaxexception(e);
        } catch (error e) {
          log.error("begin event threw error", e);
          throw e;
        }
      }
    } else {
      if (debug) {
        log.debug(" no rules found matching '" + match + "'.");
      }
    }

  }
}

与之对应的server.xml片段如下:

<service name="catalina">

  <connector port="8081" protocol="http/1.1"
        connectiontimeout="20000"
        redirectport="8443" />

  <engine name="catalina" defaulthost="localhost">

     <host name="localhost" appbase="webapps"
        unpackwars="true" autodeploy="true">
     </host>
  </engine>
</service>

digester读取到上面这些xml标签后,就会从外向里进行嵌套解析,将这些标签创建为与之对应的java类实例,也就是tomcat的主体容器结构。

以上就是java使用sax解析xml的示例的详细内容,更多关于java使用sax解析xml的资料请关注其它相关文章!

相关标签: Java SAX XML