Java使用SAX解析xml的示例
程序员文章站
2022-06-24 10:54:56
一、sax解析xml简介sax是simple api for xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的...
一、sax解析xml简介
sax是simple api for xml的简写,主要功能是用于对xml文档进行解析。由于该方式采用的是事件驱动(callback回调机制)解析方式,所以有速度快、占内存少的优点,当然这些优点也仅限于xml的读取操作,sax是无法对读取的xml元素进行修改的。如果要修改节点元素则需要使用doc方式进行将xml文件读取,它会将xml读取成document树结构对象,这样可用对节点元素进行编辑操作;doc方式的缺点也比较明显:占内存大、解析速度较慢。
所以仅用于读取xml操作,使用sax方式是比较好的方式。
二、sax解析xml实例
创建一个解析的xml文件
<?xml version="1.0" encoding="utf-8"?> <persons> <user> <userid>1001</userid> <username>张三</username> </user> <user> <userid>1002</userid> <username>李四</username> </user> </persons>
创建一个xmlparsehandler用于自定义xml解析
public class customhandler extends defaulthandler2 { list<map> list = new arraylist<>(); map map = null; string tag = ""; @override public void startdocument() throws saxexception { system.out.println("开始解析xml"); } @override public void startelement(string uri, string localname, string qname, attributes attributes) throws saxexception { system.out.println("开始解析元素: <"+ qname + ">"); if(qname == "user"){ map = new hashmap(); } tag = qname; } @override public void characters(char[] ch, int start, int length) throws saxexception { string text = new string(ch, start, length).trim(); if(text != null && !text.isempty() && tag!=null&& tag!=""){ map.put(tag, text); if(!map.containskey(tag)){ } system.out.println("解析到元素值:"+ text); } } @override public void endelement(string uri, string localname, string qname) throws saxexception { system.out.println("结束解析元素: <"+ qname + ">"); if(qname.equals("user")){ list.add(map); } tag = ""; } @override public void enddocument() throws saxexception { system.out.println("结束解析xml"); } }
创建sax解析对象解析xml
public static void main(string[] args) throws parserconfigurationexception, saxexception, ioexception { //创建xml解析工厂 saxparserfactory factory = saxparserfactory.newinstance(); //创建xml解析对象 saxparser parser = factory.newsaxparser(); file file = new file("test/custom/user.xml"); inputstream inputstream = new fileinputstream(file); customhandler customhandler = new customhandler(); //方式一 //parser.parse(inputstream, customhandler); //方式二 inputsource source = new inputsource(file.touri().tourl().tostring()); xmlreader xmlparser = parser.getxmlreader(); xmlparser.setcontenthandler(customhandler); xmlparser.parse(source); list c = customhandler.list; inputstream.close(); } //打印结果为: 开始解析xml 开始解析元素: <persons> 开始解析元素: <user> 开始解析元素: <userid> 解析到元素值:1001 结束解析元素: <userid> 开始解析元素: <username> 解析到元素值:张三 结束解析元素: <username> 结束解析元素: <user> 开始解析元素: <user> 开始解析元素: <userid> 解析到元素值:1002 结束解析元素: <userid> 开始解析元素: <username> 解析到元素值:李四 结束解析元素: <username> 结束解析元素: <user> 结束解析元素: <persons> 结束解析xml
三、sax的实际应用
在tomcat源码中,有一个digester对象,这个digester是tomcat启动时,初始化各个容器(service、engine、connetor)的执行者,而digester执行容器初始化的依据是解析配置文件server.xml的内容,根据xml的具体配置进行来初始化容器。
下面是digester的类的一些主要方法:
//org.apache.tomcat.util.digester.digester#parse(org.xml.sax.inputsource) public class digester extends defaulthandler2 { //读取解析xml public object parse(inputsource input) throws ioexception, saxexception { configure(); getxmlreader().parse(input); return root; } //对每个xml标签进行解析,并执行于之对应的rule规则列表 public void startelement(string namespaceuri, string localname, string qname, attributes list) throws saxexception { boolean debug = log.isdebugenabled(); // parse system properties list = updateattributes(list); // save the body text accumulated for our surrounding element bodytexts.push(bodytext); bodytext = new stringbuilder(); // the actual element name is either in localname or qname, depending // on whether the parser is namespace aware string name = localname; if ((name == null) || (name.length() < 1)) { name = qname; } // compute the current matching rule stringbuilder sb = new stringbuilder(match); if (match.length() > 0) { sb.append('/'); } sb.append(name); //根据每次xml节点的名称拼接成匹配url match = sb.tostring(); // fire "begin" events for all relevant rules(根据namespaceuri匹配获取的rule规则列表,有顺序规则) list<rule> rules = getrules().match(namespaceuri, match); matches.push(rules); if ((rules != null) && (rules.size() > 0)) { for (rule value : rules) { try { rule rule = value; if (debug) { log.debug(" fire begin() for " + rule); } //依次执行begin方法 rule.begin(namespaceuri, name, list); } catch (exception e) { log.error("begin event threw exception", e); throw createsaxexception(e); } catch (error e) { log.error("begin event threw error", e); throw e; } } } else { if (debug) { log.debug(" no rules found matching '" + match + "'."); } } } }
与之对应的server.xml片段如下:
<service name="catalina"> <connector port="8081" protocol="http/1.1" connectiontimeout="20000" redirectport="8443" /> <engine name="catalina" defaulthost="localhost"> <host name="localhost" appbase="webapps" unpackwars="true" autodeploy="true"> </host> </engine> </service>
digester读取到上面这些xml标签后,就会从外向里进行嵌套解析,将这些标签创建为与之对应的java类实例,也就是tomcat的主体容器结构。
以上就是java使用sax解析xml的示例的详细内容,更多关于java使用sax解析xml的资料请关注其它相关文章!