XML基础

程序员文章站 2024-01-02 23:45:46

...

今日内容

	1.概念
	2.语法
	3.解析

XML:

1.概念：（Extensible Markup Language）可扩展标记语言

（1）可扩展：标签都是自定义的。

（2）功能

* 存储数据
		1.配置文件
		2.在网络中传输

（3） xml与html的区别

	1. xml标签都是自定义的，HTML标签都是预定义。
	2. xml的语法严格，html语法松散。
	3. xml是存储数据的，html是展示数据的。
	 
* w3c:万维网联盟（百度）

2.语法：

（1）基本语法：

	1. xml文档的后缀必须是.xml
	2. xml第一行必须定义为文档声明
	3. xml文档中有且只有一个根标签
	4. 属性值必须使用引号（单双都可）引起来。
	5. 标签必须正确关闭。
	6. xml标签名称严格区分大小写。

（2）快速入门：

<?xml version='1.0' ?>
	<users>
		<user id='1'>
			<name>zhangsan</name>
			<age>23</age>
			<gender>male</gender>
		</user>
		
		<user id='2'>
			<name>lisi</name>
			<age>22</age>
			<gender>female</gender>
		</user>
	</users>

（3）组成部分：

1. 文档声明
		* 格式：<?xml 属性列表 ?>
		* 属性列表：
			* version：必须的属性
			* encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：ISO-8859-1。
			* standalone：是否独立
					* 取值：
						* yes：不依赖其他文件。（约束文件）
						* no：依赖其他文件。
			
	2. 指令（了解）：结合css的
		*  <?xml-stylesheet type="text/css" href="a.css" ?>
		*  a.css	name{color:red;}

	3. 标签:标签名称自定义的
		* 规则：
			* 名称可以包含字母数字以及其他的字符
			* 名称不能以数字或者标点符号开始
			* 名称不能以字母xml(或者XML,Xml等等)开始。
			* 名称不能包含空格
			
	4. 属性：
		id属性值唯一
		
	5. 文本：
		* CDATA区：在该区域中的数据会被原样展示。
			* 格式：<![CDATA[		]]>

3. 约束：规定xml文档的书写规则。

（1）作为框架的使用者（程序员）：（见图约束）

1. 能够在xml中引入约束文档
2. 能够简单的读懂约束文档。

01约束.png

XML基础

（2）分类：

1. DTD：一种简单的约束技术。
2. Schema：一种复杂的约束技术。

（3）DTD:(XML_DTD约束)

* 引入dtd文档到xml中
		* 内部dtd：将约束规则定义在xml文档中
		* 外部dtd：将约束的规则定义在外部的dtd文件中。
			* 本地：<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置">
			* 网络：<!DOCTYPE 根标签名 PUBLIC "dtd文件的名字" "dtd文件的位置URL">

（4） Schema:(XML_schema约束)

* 引入：
		1.填写xml文档的根元素
		2.引入xsi前缀.  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
		3.引入xsd文件命名空间.  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
		4.为每一个xsd约束声明一个前缀,作为标识  xmlns:a="http://www.itcast.cn/xml"设置
			前缀为a不写a代表空前缀， xmlns="http://www.itcast.cn/xml"

		<students xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
			  xsi:schemaLocation="http://www.itcast.cn/xml  student.xsd"
			  xmlns="http://www.itcast.cn/xml">

4.解析：操作xml文档，将文档中的数据读取到内存中

（1）操作xml文档

	1. 解析（读入）： 将文档中的数据读取到内存中。
	2. 写入：将内存中的数据保存到xml文档中。持久化的存储。（不常用）

（2）解析xml的方式：

	1. DOM思想：将标记语言文档一次性加载进内存，在内存中形成一棵dom树。
		* 优点：操作方便，可以对文档进行CRUD的所有操作。
		* 缺点：比较占内存（大小一般是xml的1000~10000倍）

dom树

XML基础
2. SAX思想：逐行读取，基于事件驱动的。（如图SAX思想）
* 优点：不占内存
* 缺点：只能读取，不能增删改查

SAX思想

（3）xml常见的解析器：

	1. JASP：sun公司提供的解析器，支持dom和sax两种思想。
	2. DOM4J:一款非常优秀的解析器，服务器端经常会采用dom4j来解析。
	3. Jsoup:是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
	4. PULL:Android操作系统内置的解析器，sax方式的。

（4）快速入门：

	* Jsoup:是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套
			非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
	* 步骤：	
			1. 导入jar包
			2. 获取Document对象
			3. 获取对应的标签Element对象
			4. 获取数据
	* 代码
	        //2、获取Document对象，根据xml文档来获取
	        //2.1获取student.xml的path
	        String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
	        //2.2解析xml文档，加载文档进内存，获取dom树
	        Document document = Jsoup.parse(new File(path), "utf-8");
	        //3.获取元素对象Element
	        Elements elements = document.getElementsByTag("name");
	        System.out.println(elements.size());
	        for(Element el:elements){
	            System.out.println(el.text());
	        }
	        //3.1获取第一个Element对象的name
	        //Element element = elements.get(0);
	        //3.2获取数据
	        //String name = element.text();
	        //System.out.println(name);

（5）对象的使用：

	1. Jsoup：工具类，可以解析HTML或者xml文档，返回Document
		* parse：解析html或xml文档，返回Document
			* parse(File in, String charsetName) ：解析xml或者html文件的。(JsoupDemo1.)
			* parse(String html)：解析字符串的(JsoupDemo2.)
			* parse(URL url, int timeoutMillis)：通过网络路径来解析html或xml文档对象(JsoupDemo3.)
	2. Document:文档对象。代表内存中的dom树(JsoupDemo4)
		* 获取Element对象
			*   getElementById(String id)：根据id属性值获取唯一的element对象
			* 	getElementsByTag(String tagName)：根据标签名称，获取元素对象集合
			* 	getElementsByAttribute(String key)：根据属性名称获取元素对象集合
			* 	getElementsByAttributeValue(String key, String value)：根据对应的属性名和属性值获取元素集合
			 	
	3. Elements：元素Element对象的集合。可以当做ArrayList<Element>来使用。
	4. Element：元素对象。(JsoupDemo5)
		1. 获取子元素对象
			*   getElementById(String id)：根据id属性值获取唯一的element对象
			* 	getElementsByTag(String tagName)：根据标签名称，获取元素对象集合
			* 	getElementsByAttribute(String key)：根据属性名称获取元素对象集合
			* 	getElementsByAttributeValue(String key, String value)：根据对应的属性名和属性值获取元素集合
		2. 获取属性值
			* attr(String key):根据属性名称获取属性值
			
		3. 获取文本内容
			* String text():获取所有字标签的纯文本内容
			* String html():获取标签体的所有内容（包括子标签的标签和文本）
	5. Node：节点对象。

JsoupDemo1_ParseXML
JsoupDemo2_ParseString
JsoupDemo3_ParseURL
JsoupDemo4_Document
JsoupDemo5_Element

（6） XMLSelector和Xpath两种快捷查询方式：

	1. selector:选择器(JsoupDemo6)
		* 使用的方法是：Elements	select(String cssQuery) 
			* 语法：参考Selector类中定义的语法

	2. Xpath：(JsoupDemo7)
		* XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言。
		* 使用Jsoup的Xpath需要额外导入jar包。（JsoupXpath-0.3.2.jar）
		* 查询w3cshool参考手册，使用Xpath的语法完成查询。

XML基础

今日内容

XML:

1.概念：（Extensible Markup Language）可扩展标记语言

（1）可扩展：标签都是自定义的。

（2）功能

（3） xml与html的区别

2.语法：

（1）基本语法：

（2）快速入门：

（3）组成部分：

3. 约束：规定xml文档的书写规则。

（1）作为框架的使用者（程序员）：（见图约束）

（2）分类：

（3）DTD:(XML_DTD约束)

（4） Schema:(XML_schema约束)

4.解析：操作xml文档，将文档中的数据读取到内存中

（1）操作xml文档

（2）解析xml的方式：

（3）xml常见的解析器：

（4）快速入门：

（5）对象的使用：

（6） XMLSelector和Xpath两种快捷查询方式：

XML基础

BBS(php & mysql)完整版(八)_php基础

初探PHP5_php基础

2012年计算机二级Access数据库基础知识笔记（8）

javascript 学习笔记（六）浏览器类型及版本信息检测代码_基础知识

PHP基础知识（三）

input 高级限制级用法_基础知识

PHP基础知识概览_PHP教程

Qt5学习：串口编程基础

亲密接触PHP之PHP语法学习笔记1_php基础

XML基础

今日内容

XML:

1.概念：（Extensible Markup Language） 可扩展标记语言

（1）可扩展：标签都是自定义的。

（2） 功能

（3） xml与html的区别

2.语法：

（1） 基本语法：

（2） 快速入门：

（3） 组成部分：

3. 约束：规定xml文档的书写规则。

（1） 作为框架的使用者（程序员）：（见图约束）

（2）分类：

（3）DTD:(XML_DTD约束)

（4） Schema:(XML_schema约束)

4.解析：操作xml文档，将文档中的数据读取到内存中

（1）操作xml文档

（2）解析xml的方式：

（3）xml常见的解析器：

（4） 快速入门：

（5）对象的使用：

（6） XMLSelector和Xpath两种快捷查询方式：

XML基础

BBS(php & mysql)完整版(八)_php基础

初探PHP5_php基础

2012年计算机二级Access数据库基础知识笔记（8）

javascript 学习笔记（六）浏览器类型及版本信息检测代码_基础知识

PHP基础知识（三）

input 高级限制级用法_基础知识

PHP基础知识概览_PHP教程

Qt5学习：串口编程基础

亲密接触PHP之PHP语法学习笔记1_php基础

1.概念：（Extensible Markup Language）可扩展标记语言

（2）功能

（1）基本语法：

（2）快速入门：

（3）组成部分：

（1）作为框架的使用者（程序员）：（见图约束）

（4）快速入门：