JAVA基础之XML相关
个人理解:
知晓xml与html的不同,知道其的*性和约束的方式(规范)!数据按schema约束写到xml里,然后通过dom4j解析出所有的元素,再用反射创建对象接着调出其所有的方法!!!特别要熟练掌握反射的3种创建对象的方法!
一、模拟servlet执行
了解web服务器就是另一台计算机。
为了灵活实现的不同路径(/hello)执行不同的资源( heiiomyservlet)我们需要使用xml进行配置;为了限定xml内容,我们需要使用xml约束(dtd或schema);为了获得xml的内容,我们需要使用dom4j进行解析。然后可以通过反射进行创建对象,获取其中的方法。
二、xml介绍:
xml个称为extensible markup language,意思是可扩展的标记语言。xml语法上和html比较相似,但html中的元素是固定的,而xml的标签是可以由用户自定义的。
w3c在1998年2月发布1.0版本,2004年2月义发布1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月w3c又发布了1.0版本的第三版。我们要学习的还是1.0版本!!!
三、xml语法:
1、文档声明:
<?xml version="1.0" encoding="utf-8"?>
①、文档声明必须为<?xml开头,以?>结束;
②、文档声明必须从文档的0行0列位置开始:(注释也不能加!!!)
③、文档声明只有属性:
a) versioin:指定xml文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8:
2、元素element:
①.元素是xml文档中最重要的组成部分,
②.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
③.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a ></b>
④.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介,例如:<c/>
⑤.元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以xml, xml, xml开头
⑥.格式化良好的xml文档,必须只有一个根元素。
3、属性:
①.属性是元素的一部分,它必须出现在元素的开始标签中
②.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
③.一个元素可以有o ~ n个属性,但一个元素中不能出现同名属性
④.属性名不能使用空格、冒号等特殊字符,且必须以字母开头
4、注释:
xml的注释与html相同,即以“<!--”开始,以“-->”结束。注释内容会被xml解析器忽略!
5、转义字符:
xml中的转义字符与html一样。
因为很多符号己经被xml文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:"<"、”>”、” ’ ”、” ” ”、”&”。
6、cdata区:
在cdata段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在cdata段中不能包含“]]>”,即cdata段的结束定界符。
<?xml version="1.0" encoding="utf-8"?> <persons> <person class="黑色" height="192"> <name>熊二</name> <age>22</age> </person> <person> <name>熊大</name> <age> <!-- 转义字符出现在以下区域内,会自动转义! --> <![cdata[ if(10>9&&9>8){ aaaa; } ]]> </age> </person> </persons>
四、dtd:
1、dtd (document type definition ),文档类型定义,用来约束xml文档。规定xml文档中元素的名称,子元素的名称及顺序,元素的属性等。
2、我们都是通过框架提供的dtd约束文档,编写对应的xml文档。常见框架使用dtd约束有:struts2, hibernate等。
<?xml version="1.0" encoding="utf-8"?> <!-- 模拟servlet2.3规范,如果开发人员需要在xml使用当前dtd约束,必须包括doctype。 格式如下: <!doctype web-app system "web-app_2_3.dtd"> --> <!element web-app (servlet*,servlet-mapping* , welcome-file-list?) > <!element servlet (servlet-name,description?,(servlet-class|jsp-file))> <!element servlet-mapping (servlet-name,url-pattern+) > <!element servlet-name (#pcdata)> <!element servlet-class (#pcdata)> <!element url-pattern (#pcdata)> <!element description (#pcdata)> <!element jsp-file (#pcdata)> <!element welcome-file-list (welcome-file+)> <!element welcome-file (#pcdata)> <!attlist web-app version cdata #implied>
<?xml version="1.0" encoding="utf-8"?> <!doctype web-app system "web-app_2_3.dtd"> <web-app> <servlet> <servlet-name>helloservlet</servlet-name> <servlet-class>com.oracle.demo01.helloservlet</servlet-class> </servlet> <servlet-mapping> <servlet-name>helloservlet</servlet-name> <url-pattern>/hello</url-pattern> </servlet-mapping> </web-app>
3、文档声明:
①、内部dtd,在xml文档内部嵌入dtd,只对当前xml有效。
②、外部dtd——本地dtd,dtd文档在本地系统system上,公司内部自己项目使用。
③、外部dtd——公共dtd,dtd文档在网络public+网址上,一般都有框架提供。
4、元素声明:
定义元素语法:<!element元素名 元素描述>
元素名:自定义
元素描述包括 : 符号和数据类型
常见符号: ? * + () | ,
常见类型:#pcdata表示内容是文本,不能是子标签
五、schema约束:
1、介绍:
①、schema是新的xml文档约束:
②、 schema要比dtd强大很多,是dtd替代者;
③、schema本身也是xml文档,但schema文档的扩展名为xsd,而不是xml .
④、 schema功能更强大,数据类型更完善
⑤、schema支持名称空间
2、通过schema约束文档编写xml文档。常见框架使用schema的有:spring等通过提供”web-app_ 2_ 5.xsd"编写xml文档
<?xml version="1.0" encoding="utf-8"?> <!-- 模拟servlet2.5规范,如果开发人员需要在xml使用当前schema约束,必须包括指定命名空间。 格式如下: <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xsi:schemalocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> --> <xsd:schema xmlns="http://www.w3.org/2001/xmlschema" targetnamespace="http://www.example.org/web-app_2_5" xmlns:xsd="http://www.w3.org/2001/xmlschema" xmlns:tns="http://www.example.org/web-app_2_5" elementformdefault="qualified"> <xsd:element name="web-app"> <xsd:complextype> <xsd:choice minoccurs="0" maxoccurs="unbounded"> <xsd:element name="servlet"> <xsd:complextype> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="servlet-class"></xsd:element> </xsd:sequence> </xsd:complextype> </xsd:element> <xsd:element name="servlet-mapping"> <xsd:complextype> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="url-pattern" maxoccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complextype> </xsd:element> <xsd:element name="welcome-file-list"> <xsd:complextype> <xsd:sequence> <xsd:element name="welcome-file" maxoccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complextype> </xsd:element> </xsd:choice> <xsd:attribute name="version" type="double" use="optional"></xsd:attribute> </xsd:complextype> </xsd:element> </xsd:schema>
<?xml version="1.0" encoding="utf-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xsi:schemalocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name></servlet-name> <servlet-class></servlet-class> </servlet> <servlet-mapping> <servlet-name></servlet-name> <url-pattern></url-pattern> </servlet-mapping> </web-app>
六、dom4j解析:
1、xml的解析方式:
开发中比较常见的解析方式有三种,如下:
①、dom:要求解析器把整个xml文档装载到内存,并解析成一个document对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点:xml文档过大,可能出现内存溢出显现。
②、sax:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
③、pull: android内置的xml解析方式,类似sax。(了解)
2、解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
①、 jaxp: sun公司提供支持dom和sax开发包
②、 jdom:dom4j兄弟
③、 jsoup:一种处理html特定解析开发包
④、dom4j:比较常用的解析开发包,hibernate底层采用。
3、dom解析原理及结构模型:
xml dom和html dom类似,xml dom将整个xml文档加载到内存,生成一个dom树,
并获得一个document对象,通过document对象就可以对dom进行操作。
dom中的核心概念就是节点,在xml文档中的元素、属性、文本等,在dom中都是节点!
4、api使用:
dom4j必须使用核心类saxreader加载xml文档获得document通过document对象获得文档的根元素,然后就可以操作了。
七、解析步骤:
1.创建解析器对象
2.使用解析器加载web.xml文件得到document对象
3.获取根元素节点
4.根据元素名称获取子元素节点
5.根据元素名称获取servlet-class的文本节点
6.通过类全名获取字节码文件
7.创建实例对象
8.调用实例对象里面的方法
package com.oracle.demo04; public class myservlet { public void init(){ system.out.println("init()正在执行"); } public void service(){ system.out.println("service()正在执行"); } public void destroy(){ system.out.println("destory()正在执行"); } }
<?xml version="1.0" encoding="utf-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xsi:schemalocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.oracle.demo04.myservlet</servlet-class> </servlet> <servlet-mapping> <servlet-name>myservlet</servlet-name> <url-pattern>/my</url-pattern> </servlet-mapping> </web-app>
package com.oracle.demo04; import org.dom4j.document; import org.dom4j.documentexception; import org.dom4j.element; import org.dom4j.io.saxreader; //将数据按schema约束写到xml里,然后通过dom4j解析出所有的元素,再用反射创建对象再调出其所有的方法!!! public class demo { public static void main(string[] args) throws documentexception, classnotfoundexception, instantiationexception, illegalaccessexception { // 1.获取解析器 saxreader sax=new saxreader(); // 2.获得document文档对象 document doc=sax.read("src/com/oracle/demo04/web.xml"); // 3.获取根元素 element element=doc.getrootelement(); // 4.判断元素名称为servlet的元素 element servlet=element.element("servlet"); // 5.获取servlet-class元素 element classname=servlet.element("servlet-class"); //system.out.println(classname.gettext());获取当前元素的文本内容 //开始反射获取myservlet的字节码文件对象 class c=class.forname(classname.gettext()); //快速创建对象 object obj=c.newinstance(); //向下转型 myservlet my=(myservlet) obj; my.init(); my.service(); my.destroy(); } }
上一篇: python正则表达式之对号入座篇
下一篇: 突如其来的卑微