欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

解析 XML格式数据

程序员文章站 2022-07-07 12:28:52
...

通常情况下,每个需要访问网络的应用程序都会有一个自己的服务器,我们可以向服务 器提交数据,也可以从服务器上获取数据
不过这个时候就出现了一个问题,这些数据到底 要以什么样的格式在网络上传输呢?
在网络上传输数据时最常用的格式有两种,XML和 JSON,今天先学习如何解析 XML格式的数据

在开始之前我们还需要先解决一个问题,就是从哪儿才能获取一段 XML 格式的数据?这里我准备教你搭建一个最简单的 Web服务器,在这个服务器上提供一段 XML文本, 然后我们在程序里去访问这个服务器,再对得到的 XML文本进行解析

1、首先配置apache服务器,可以看以下文章

Apache服务器的下载与安装

2、在htdocs目录下新建get_data.xml文件,文件内容如下

<?xml version="1.0"?>
<apps>
  <app>
    <id>1</id>
    <name>Google Maps</name>
    <version>1.0</version>
  </app>
  <app>
    <id>2</id>
    <name>Chrome</name>
    <version>2.1</version>
  </app>
  <app>
    <id>3</id>
    <name>Google Play</name>
    <version>2.3</version>
  </app>
</apps>

ps:如果想要格式化xml文件可以查看这篇文章 [EditPlus格式化XML]
http://blog.csdn.net/u011498933/article/details/53130112

3、现在访问get_data.xml时,页面如下

解析 XML格式数据

既然 XML格式的数据已经提供好了,现在要做的就是从中解析出我们想要得到的那部分内容

Pull解析方式

以下代码是基于
HttpURLConnection使用这篇文章进行的修改

只修改MainActivity.java代码

 private void sendRequestWithURLConnection() {
        //开启线程发起网络请求
        new Thread(new Runnable() {
            @Override
            public void run() {
                HttpURLConnection connection = null;
                try {
                    URL url = new URL("http://192.168.1.51/get_data.xml");
                    connection = (HttpURLConnection) url.openConnection();
                    connection.setRequestMethod("GET");
                    connection.setConnectTimeout(8000);
                    connection.setReadTimeout(8000);
                    InputStream inputStream = connection.getInputStream();
                    //对获取的输入流进行读取
                    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
                    StringBuilder response = new StringBuilder();

                    String line;
                    while ((line = reader.readLine()) != null) {
                        response.append(line);
                    }
                    parseXMLWithPull(response.toString());

                } catch (MalformedURLException e) {

                } catch (ProtocolException e) {
                    e.printStackTrace();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }).start();
    }

    private void parseXMLWithPull(String xmlData) {
        try {
            XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
            XmlPullParser xmlPullParser = factory.newPullParser();
            xmlPullParser.setInput(new StringReader(xmlData));

            int eventType = xmlPullParser.getEventType();
            String id = "";
            String name = "";
            String version = "";

            while (eventType != XmlPullParser.END_DOCUMENT) {
                String nodeName = xmlPullParser.getName();
                switch (eventType) {
                    case XmlPullParser.START_TAG:
                        //开始解析某个节点
                        if ("id".equals(nodeName)) {
                            id = xmlPullParser.nextText();
                        } else if ("name".equals(nodeName)) {
                            name = xmlPullParser.nextText();
                        } else if ("version".equals(nodeName)) {
                            version = xmlPullParser.nextText();
                        }
                        break;
                    case XmlPullParser.END_TAG:
                        if("app".equals(nodeName)){
                            Log.d("MainActivity","id is "+id);
                            Log.d("MainActivity","name is "+name);
                            Log.d("MainActivity","version is "+version);
                        }
                        break;
                    default:
                        break;
                }
                eventType = xmlPullParser.next();
            }
        } catch (XmlPullParserException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

和之前文章相比有两处修改:
1、其中Url变成”http://192.168.1.51/get_data.xml“,http://192.168.1.51对于模拟器来说就是电脑本机的 IP地址,如何查看本机ip地址呢,可以参考以下文章

[查看电脑ip地址]
http://blog.csdn.net/u010356768/article/details/77744688

2、在得到了服务器返回的数据后,我们并不再去发 送一条消息,而是调用了 parseXMLWithPull()方法来解析服务器返回的数据

解释parseXMLWithPull()方法

首先要获取到一个 XmlPullParserFactory 的 实 例 , 并 借 助 这 个 实 例 得 到 XmlPullParser 对象,然后调用 XmlPullParser的 setInput()方法将服务器返回的 XML数据设置进去就可以开始解析了

解析的过程也是非常简单,通过getEventType()可以得到当前的解析事件,然后在一个 while循环 中不断地进行解析

如果当前的解析事件不等于 XmlPullParser.END_DOCUMENT,说明解析工作还没完成,调用 next()方法后可以获取下一个解析事件

在 while循环中,我们通过 getName()方法得到当前结点的名字,如果发现结点名等于 id、name或 version,就调用 nextText()方法来获取结点内具体的内容,每当解析完一个 app 结点后就将获取到的内容打印出来

观察 LogCat中的打印日志
解析 XML格式数据

我们已经将 XML数据中的指定内容成功解析出来了

SAX解析方式

SAX解析也是一种特别常 用的 XML解析方式,虽然它的用法比 Pull解析要复杂一些,但在语义方面会更加的清楚

通常情况下我们都会新建一个类继承自 DefaultHandler,并重写父类的五个方法,如下 所示

public class MyHandler extends DefaultHandler {
    @Override
    public void startDocument() throws SAXException {
        super.startDocument();
    }

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes)
            throws SAXException {
        super.startElement(uri, localName, qName, attributes);
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        super.characters(ch, start, length);
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        super.endElement(uri, localName, qName);
    }

    @Override
    public void endDocument() throws SAXException {
        super.endDocument();
    }
}

startDocument()方法会在开始 XML 解析的时候调用

startElement()方法会在开始解析某个结点的时候调用

characters()方法会在获取结点中内容 的时候调用

endElement()方法会在完成解析某个结点的时候调用

endDocument()方法会在 完成整个 XML解析的时候调用

其中,startElement()、characters()和 endElement()这三个方 法是有参数的,从 XML中解析出的数据就会以参数的形式传入到这些方法中。需要注意的 是,在获取结点中的内容时,characters()方法可能会被调用多次,一些换行符也被当作内容 解析出来,我们需要针对这种情况在代码中做好控制

那么下面就让我们尝试用 SAX解析的方式来实现和上一小节中同样的功能吧

MyHandler

public class MyHandler extends DefaultHandler {

    private String nodeName;
    private StringBuilder id;
    private StringBuilder name;
    private StringBuilder version;

    @Override
    public void startDocument() throws SAXException {
        super.startDocument();

        id = new StringBuilder();
        name = new StringBuilder();
        version = new StringBuilder();
    }

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes)
            throws SAXException {
        super.startElement(uri, localName, qName, attributes);

        //记录当前节点名
        nodeName = localName;
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        super.characters(ch, start, length);

        //根据当前的结点名判断将内容添加到哪个StringBulder对象中
        if("id".equals(nodeName)){
            id.append(ch,start,length);
        }else if("name".equals(nodeName)){
            name.append(ch,start,length);
        }else if("version".equals(nodeName)){
            version.append(ch,start,length);
        }
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        super.endElement(uri, localName, qName);

        if("app".equals(localName)){
            Log.d("MyHandler","id is "+id.toString().trim());
            Log.d("MyHandler","name is "+name.toString().trim());
            Log.d("MyHandler","version is "+version.toString().trim());

            //最后把StringBuilder清空
            id.setLength(0);
            name.setLength(0);
            version.setLength(0);
        }
    }

    @Override
    public void endDocument() throws SAXException {
        super.endDocument();
    }
}

我们首先给 id、name和 version结点分别定义了一个 StringBuilder对象,并 在 startDocument()方法里对它们进行了初始化

每当开始解析某个结点的时候,startElement()方法就会得到调用,其中 localName参数记录着当前结点的名字,这里我们把它记录下来

接着在解析结点中具体内容的时候就会调用 characters()方法,我们会根据当前的结点名进行 判断,将解析出的内容添加到哪一个 StringBuilder对象中

最后在 endElement()方法中进行 判断,如果 app结点已经解析完成,就打印出 id、name和 version的内容

需要注意的是, 目前 id、name和 version中都可能是包括回车或换行符的,因此在打印之前我们还需要调用 一下 trim()方法,并且打印完成后还要将 StringBuilder的内容清空掉,不然的话会影响下一 次内容的读取

接下来的工作就非常简单了,修改 MainActivity中的代码,如下所示:

private void sendRequestWithURLConnection() {
        //开启线程发起网络请求
        new Thread(new Runnable() {
            @Override
            public void run() {
                HttpURLConnection connection = null;
                try {
                    URL url = new URL("http://192.168.1.51/get_data.xml");
                    connection = (HttpURLConnection) url.openConnection();
                    connection.setRequestMethod("GET");
                    connection.setConnectTimeout(8000);
                    connection.setReadTimeout(8000);
                    InputStream inputStream = connection.getInputStream();
                    //对获取的输入流进行读取
                    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
                    StringBuilder response = new StringBuilder();

                    String line;
                    while ((line = reader.readLine()) != null) {
                        response.append(line);
                    }
                    parseXMLWithSAX(response.toString());

                } catch (MalformedURLException e) {

                } catch (ProtocolException e) {
                    e.printStackTrace();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }).start();
    }

    private void parseXMLWithSAX(String xmlData){
        SAXParserFactory factory = SAXParserFactory.newInstance();
        XMLReader xmlReader = null;
        try {
            xmlReader = factory.newSAXParser().getXMLReader();
        } catch (SAXException e) {
            e.printStackTrace();
        } catch (ParserConfigurationException e) {
            e.printStackTrace();
        }
        MyHandler handler = new MyHandler();
        //将ContentHandler的实例设置到XMLReader中
        xmlReader.setContentHandler(handler);
        //开始执行解析
        try {
            xmlReader.parse(new InputSource(new StringReader(xmlData)));
        } catch (IOException e) {
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        }
    }

在得到了服务器返回的数据后,我们这次去调用 parseXMLWithSAX()方法来解析 XML 数据

parseXMLWithSAX()方法中先是创建了一个 SAXParserFactory的对象,然后再获取到 XMLReader对象,接着将我们编写的 ContentHandler的实例设置到 XMLReader中

最后调 用 parse()方法开始执行解析就好了

现在重新运行一下程序,点击 Send Request按钮后观察 LogCat中的打印日志,你会看 到和Pull方式中解析的一样的结果