xml笔记

程序员文章站 2023-11-21 16:08:28

# 今日内容 1. XML 1. 概念 2. 语法 3. 解析 ## XML： 1. 概念：Extensible Markup Language 可扩展标记语言 * 可扩展：标签都是自定义的。 * 功能 * 存储数据 1. 配置文件 2. 在网络中传输 * xml与 ......

# 今日内容
    1. xml
        1. 概念
        2. 语法
        3. 解析

## xml：
    1. 概念：extensible markup language 可扩展标记语言
        * 可扩展：标签都是自定义的。 <user>  <student>

        * 功能
            * 存储数据
                1. 配置文件
                2. 在网络中传输
        * xml与html的区别
            1. xml标签都是自定义的，html标签是预定义。
            2. xml的语法严格，html语法松散
            3. xml是存储数据的，html是展示数据

        * w3c:万维网联盟

    2. 语法：
        * 基本语法：
            1. xml文档的后缀名 .xml
            2. xml第一行必须定义为文档声明
            3. xml文档中有且仅有一个根标签
            4. 属性值必须使用引号(单双都可)引起来
            5. 标签必须正确关闭
            6. xml标签名称区分大小写
        * 快速入门：

 1 <?xml version='1.0' ?>
 2             <users>
 3                 <user id='1'>
 4                     <name>zhangsan</name>
 5                     <age>23</age>
 6                     <gender>male</gender>
 7                     <br/>
 8                 </user>
 9                 
10                 <user id='2'>
11                     <name>lisi</name>
12                     <age>24</age>
13                     <gender>female</gender>
14                 </user>
15             </users>

* 组成部分：
            1. 文档声明
                1. 格式：<?xml 属性列表 ?>
                2. 属性列表：
                    * version：版本号，必须的属性
                    * encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：iso-8859-1
                    * standalone：是否独立
                        * 取值：
                            * yes：不依赖其他文件
                            * no：依赖其他文件
            2. 指令(了解)：结合css的
                * <?xml-stylesheet type="text/css" href="a.css" ?>
            3. 标签：标签名称自定义的
                * 规则：
                    * 名称可以包含字母、数字以及其他的字符
                    * 名称不能以数字或者标点符号开始
                    * 名称不能以字母 xml（或者 xml、xml 等等）开始
                    * 名称不能包含空格

            4. 属性：
                id属性值唯一
            5. 文本：
                * cdata区：在该区域中的数据会被原样展示
                    * 格式：  <![cdata[ 数据 ]]>


        * 约束：规定xml文档的书写规则
            * 作为框架的使用者(程序员)：
                1. 能够在xml中引入约束文档
                2. 能够简单的读懂约束文档

            * 分类：
                1. dtd:一种简单的约束技术
                2. schema:一种复杂的约束技术

            * dtd：
                * 引入dtd文档到xml文档中
                    * 内部dtd：将约束规则定义在xml文档中
                    * 外部dtd：将约束的规则定义在外部的dtd文件中
                        * 本地：<!doctype 根标签名 system "dtd文件的位置">
                        * 网络：<!doctype 根标签名 public "dtd文件名字" "dtd文件的位置url">

            * schema:
                * 引入：
                    1.填写xml文档的根元素
                    2.引入xsi前缀.  xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"
                    3.引入xsd文件命名空间.  xsi:schemalocation="http://www.itcast.cn/xml  student.xsd"
                    4.为每一个xsd约束声明一个前缀,作为标识  xmlns="http://www.itcast.cn/xml"

                <students   xmlns:xsi="http://www.w3.org/2001/xmlschema-instance"
                    xmlns="http://www.itcast.cn/xml"
                    xsi:schemalocation="http://www.itcast.cn/xml  student.xsd">



    3. 解析：操作xml文档，将文档中的数据读取到内存中
        * 操作xml文档
            1. 解析(读取)：将文档中的数据读取到内存中
            2. 写入：将内存中的数据保存到xml文档中。持久化的存储

        * 解析xml的方式：
            1. dom：将标记语言文档一次性加载进内存，在内存中形成一颗dom树
                * 优点：操作方便，可以对文档进行crud的所有操作
                * 缺点：占内存
            2. sax：逐行读取，基于事件驱动的。
                * 优点：不占内存。
                * 缺点：只能读取，不能增删改


        * xml常见的解析器：
            1. jaxp：sun公司提供的解析器，支持dom和sax两种思想
            2. dom4j：一款非常优秀的解析器
            3. jsoup：jsoup 是一款java 的html解析器，可直接解析某个url地址、html文本内容。它提供了一套非常省力的api，可通过dom，css以及类似于jquery的操作方法来取出和操作数据。
            4. pull：android操作系统内置的解析器，sax方式的。

        * jsoup：jsoup 是一款java 的html解析器，可直接解析某个url地址、html文本内容。它提供了一套非常省力的api，可通过dom，css以及类似于jquery的操作方法来取出和操作数据。
            * 快速入门：
                * 步骤：
                    1. 导入jar包
                    2. 获取document对象
                    3. 获取对应的标签element对象
                    4. 获取数据

            * 代码：

 1  //2.1获取student.xml的path
 2                 string path = jsoupdemo1.class.getclassloader().getresource("student.xml").getpath();
 3                 //2.2解析xml文档，加载文档进内存，获取dom树--->document
 4                 document document = jsoup.parse(new file(path), "utf-8");
 5                 //3.获取元素对象 element
 6                 elements elements = document.getelementsbytag("name");
 7         
 8                 system.out.println(elements.size());
 9                 //3.1获取第一个name的element对象
10                 element element = elements.get(0);
11                 //3.2获取数据
12                 string name = element.text();
13                 system.out.println(name);

* 对象的使用：
            1. jsoup：工具类，可以解析html或xml文档，返回document
                * parse：解析html或xml文档，返回document
                    * parse(file in, string charsetname)：解析xml或html文件的。
                    * parse(string html)：解析xml或html字符串
                    * parse(url url, int timeoutmillis)：通过网络路径获取指定的html或xml的文档对象
            2. document：文档对象。代表内存中的dom树
                * 获取element对象
                    * getelementbyid(string id)：根据id属性值获取唯一的element对象
                    * getelementsbytag(string tagname)：根据标签名称获取元素对象集合
                    * getelementsbyattribute(string key)：根据属性名称获取元素对象集合
                    * getelementsbyattributevalue(string key, string value)：根据对应的属性名和属性值获取元素对象集合
            3. elements：元素element对象的集合。可以当做 arraylist<element>来使用
            4. element：元素对象
                1. 获取子元素对象
                    * getelementbyid(string id)：根据id属性值获取唯一的element对象
                    * getelementsbytag(string tagname)：根据标签名称获取元素对象集合
                    * getelementsbyattribute(string key)：根据属性名称获取元素对象集合
                    * getelementsbyattributevalue(string key, string value)：根据对应的属性名和属性值获取元素对象集合

                2. 获取属性值
                    * string attr(string key)：根据属性名称获取属性值
                3. 获取文本内容
                    * string text():获取文本内容
                    * string html():获取标签体的所有内容(包括字标签的字符串内容)
            5. node：节点对象
                * 是document和element的父类


        * 快捷查询方式：
            1. selector:选择器
                * 使用的方法：elements    select(string cssquery)
                    * 语法：参考selector类中定义的语法
            2. xpath：xpath即为xml路径语言，它是一种用来确定xml（标准通用标记语言的子集）文档中某部分位置的语言
                * 使用jsoup的xpath需要额外导入jar包。
                * 查询w3cshool参考手册，使用xpath的语法完成查询
                * 代码：

 1 //1.获取student.xml的path
 2                     string path = jsoupdemo6.class.getclassloader().getresource("student.xml").getpath();
 3                     //2.获取document对象
 4                     document document = jsoup.parse(new file(path), "utf-8");
 5             
 6                     //3.根据document对象，创建jxdocument对象
 7                     jxdocument jxdocument = new jxdocument(document);
 8             
 9                     //4.结合xpath语法查询
10                     //4.1查询所有student标签
11                     list<jxnode> jxnodes = jxdocument.seln("//student");
12                     for (jxnode jxnode : jxnodes) {
13                         system.out.println(jxnode);
14                     }
15             
16                     system.out.println("--------------------");
17             
18                     //4.2查询所有student标签下的name标签
19                     list<jxnode> jxnodes2 = jxdocument.seln("//student/name");
20                     for (jxnode jxnode : jxnodes2) {
21                         system.out.println(jxnode);
22                     }
23             
24                     system.out.println("--------------------");
25             
26                     //4.3查询student标签下带有id属性的name标签
27                     list<jxnode> jxnodes3 = jxdocument.seln("//student/name[@id]");
28                     for (jxnode jxnode : jxnodes3) {
29                         system.out.println(jxnode);
30                     }
31                     system.out.println("--------------------");
32                     //4.4查询student标签下带有id属性的name标签 并且id属性值为itcast
33             
34                     list<jxnode> jxnodes4 = jxdocument.seln("//student/name[@id='itcast']");
35                     for (jxnode jxnode : jxnodes4) {
36                         system.out.println(jxnode);
37                     }

上一篇： Tensorflow复现DenseNet cifar-10（正确率91%）

下一篇： C#实现缩放字体的方法

xml笔记

android中用xml文件实现带边框背景效果的方法

Javascript格式化并高亮xml字符串

Thinkpad笔记本安装系统蓝屏的解决

Docker学习笔记之k8s部署方法

Docker学习笔记之Weave实现跨主机容器互联

笔记本使用中常见问题和使用小技巧

Python中使用dom模块生成XML文件示例

Python字符串特性及常用字符串方法的简单笔记

xml笔记

vue.js学习笔记之绑定style样式和class列表