DTD详解
DTD详解
基本概述
文档类型定义(Document Type Definition)是一套为了进行程序间的数据交换而建立的关于标记符的语法规则。它是标准通用标记语言(SGML)和可扩展标记语言(XML)1.0版规格的一部分,文档可根据某种DTD语法规则验证格式是否符合此规则。文档类型定义也可用做保证标准通用标记语言、可扩展标记语言文档格式的合法性,可通过比较文档和文档类型定义文件来检查文档是否符合规范,元素和标签使用是否正确。文件实例提供应用程序一个数据交换的格式。
PS:简而言之,DTD就是用来约束XML文档的,使其在一定的规范下使用,除了DTD技术外,还有Schema技术,也是用于约束XML文档的。
参考文档:DTD http://www.php.cn/
参考文档:Schema http://www.php.cn/
DTD原理图
PS:通过DTD约束,XML就能在DTD的约束下进行自定义了,不过DTD有个缺点,那就是不能对数据进行数值约束这种范围约束。
DTD文档的声明及引用
内部DTD文档
<!DOCTYPE 根元素 [定义内容]>
外部DTD文档
<!DOCTYPE 根元素 SYSTEM "DTD文件路径">
内外部DTD文档结合
<!DOCTYPE 根元素 SYSTEM "DTD文件路径" [
定义内容
]>
注意事项:
1、定义关键字一定要大写,例如:DOCTYPE、ELEMENT、ATTLIST。
2、
当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>
当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
DTD元素
基本语法
<!ELEMENT NAME CONTENT>
解释:
ELEMENT:关键字(必须大写)。
NAME:元素名称。
CONTENT:元素类型,有四种,都必须大写。
1、EMPTY-该元素不能包含子元素和文本,但可以有属性(空元素)
2、ANY-该元素可以包含任何在DTD中定义的元素内容
3、#PCDATA-可以包含任何字符数据,但是不能在其中包含任何子元素
4、其它类型(组合),可以是子元素,子元素与修饰符组合,基本元素与子元素与修饰符组合。
案例:
<!ELEMENT 班级 (学生+,作者)>
<!ELEMENT 学生 (名字,年龄,介绍)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 名字 (#PCDATA)>
<!ELEMENT 年龄 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
修饰符
符号 |
用途 |
示例 |
示例说明 |
( ) |
用来给元素分组 |
(古龙|金庸|梁羽生),(王朔|余杰) |
分成两组 |
| |
在列出的对象中选择一个 |
(男人|女人) |
表示男人或者女人必须出现,而且只能选一个 |
+ |
该对象最少出现一次,可以出现多次 (1或多次) |
(成员+) |
表示成员必须出现,而且可以出现多个成员 |
* |
该对象允许出现零次到任意多次(0到多次) |
(爱好*) |
爱好可以出现零次到多次 |
? |
该对象可以出现,但只能出现一次 (0到1次) |
(菜鸟?) |
菜鸟可以出现,也可以不出现,如果出现的话,最多只能出现一次 |
, |
对象必须按指定的顺序出现 |
(西瓜,苹果,香蕉) |
表示西瓜、苹果、香蕉必须出现,并且按这个顺序出现 |
DTD属性
基本语法
<!ATTLIST 元素名称
属性名称 类型 属性特性
属性名称 类型 属性特性…...
>
解释:
ATTLIST:属性列表,(必须大写)。
元素名称:对应的元素的名称。
属性:属性能够有多个,其格式是名称 类型 属性特性
类型:
PS:常用的有CDATA(字符型),枚举(枚举格式是(值1|值2|值3...)),ID(ID不能重复,不能以数字开头),IDREF(引用另一个ID值),IDREFS(可以引用多个ID值,以空格隔开)
属性特性有:
案例:
<!ELEMENT 班级 (学生+,作者)> <!ATTLIST 班级 班次 CDATA "1班" 编号 ID #REQUIRED > <!ELEMENT 学生 (名字,年龄,介绍)> <!ELEMENT 作者 (#PCDATA)> <!ATTLIST 学生 地址 CDATA #IMPLIED 授课方式 CDATA #FIXED "面授" 学号 ID #REQUIRED 班级编号 IDREF #REQUIRED 朋友 IDREFS #IMPLIED > <!ELEMENT 名字 (#PCDATA)> <!ELEMENT 年龄 (#PCDATA)> <!ELEMENT 介绍 (#PCDATA)>
实体
实体有引用实体和参数实体两种,引用实体一般是在XML使用,参数实体一般是在DTD中使用。
基本语法
<!ENTITY 实体名称 “实体内容” > // 引用实体
<!ENTITY % 实体名称 "实体内容" > // 参数实体
解释:
1、引用实体可以在引用了DTD的XML文件中,使用&实体名称;来使用实体内容。
2、不知道是不是我的电脑原因,外部DTD中不能用引用实体,如果用将引用实体定义放在内部DTD中,则可以使用。
3、参数实体在DTD中使用,使用%实体名称;使用
4、可以将那些重复使用的值定义成实体,这样能减少代码的冗余度。
5、在外部DTD中,引用实体最好放在DTD底部,参数实体最好放在DTD顶部。
案例:
<!ENTITY % sex "男|女"> <!ELEMENT 班级 (学生+,作者)> <!ELEMENT 学生 (名字,年龄,介绍)> <!ELEMENT 作者 (#PCDATA)> <!ATTLIST 学生 性别 (%sex;) #REQUIRED > <!ELEMENT 名字 (#PCDATA)> <!ELEMENT 年龄 (#PCDATA)> <!ELEMENT 介绍 (#PCDATA)> <!ENTITY writer "Switch">
综合案例1:
XML3.dtd
<!ENTITY % sex "男|女"> <!ELEMENT 班级 (学生+,作者)> <!ATTLIST 班级 班次 CDATA "1班" 编号 ID #REQUIRED > <!ELEMENT 学生 (名字,年龄,介绍)> <!ELEMENT 作者 (#PCDATA)> <!ATTLIST 学生 地址 CDATA #IMPLIED 授课方式 CDATA #FIXED "面授" 学号 ID #REQUIRED 班级编号 IDREF #REQUIRED 朋友 IDREFS #IMPLIED 性别 (%sex;) #REQUIRED > <!ELEMENT 名字 (#PCDATA)> <!ELEMENT 年龄 (#PCDATA)> <!ELEMENT 介绍 (#PCDATA)>
XML3.xml
<?xml version="1.0" encoding="UTF-8"?> <!-- 引入DTD --> <!DOCTYPE 班级 SYSTEM "XML3.dtd" [<!ENTITY writer "Switch">]> <班级 编号="C1" 班次="1班"> <学生 地址="湖南" 授课方式="面授" 学号="n1" 班级编号="C1" 朋友="n2" 性别="男"> <名字>张三</名字> <年龄>20</年龄> <介绍>不错</介绍> </学生> <学生 授课方式="面授" 学号="n2" 班级编号="C1" 朋友="n1 n3" 性别="女"> <名字>李四</名字> <年龄>18</年龄> <介绍>很好</介绍> </学生> <学生 授课方式="面授" 学号="n3" 班级编号="C1" 朋友="n2" 性别="男"> <名字>王五</名字> <年龄>22</年龄> <介绍>非常好</介绍> </学生> <作者>&writer;</作者> </班级>
综合案例2:
XML4.dtd
<!ENTITY AUTHOR "John Doe"> <!ENTITY COMPANY "JD Power Tools, Inc."> <!ENTITY EMAIL "jd@jd-tools.com"> <!ELEMENT CATALOG (PRODUCT+)> <!ELEMENT PRODUCT (SPECIFICATIONS+,OPTIONS?,PRICE+,NOTES?)> <!ATTLIST PRODUCT NAME CDATA #IMPLIED CATEGORY (HandTool|Table|Shop-Professional) "HandTool" PARTNUM CDATA #IMPLIED PLANT (Pittsburgh|Milwaukee|Chicago) "Chicago" INVENTORY (InStock|Backordered|Discontinued) "InStock"> <!ELEMENT SPECIFICATIONS (#PCDATA)> <!ATTLIST SPECIFICATIONS WEIGHT CDATA #IMPLIED POWER CDATA #IMPLIED> <!ELEMENT OPTIONS (#PCDATA)> <!ATTLIST OPTIONS FINISH (Metal|Polished|Matte) "Matte" ADAPTER (Included|Optional|NotApplicable) "Included" CASE (HardShell|Soft|NotApplicable) "HardShell"> <!ELEMENT PRICE (#PCDATA)> <!ATTLIST PRICE MSRP CDATA #IMPLIED WHOLESALE CDATA #IMPLIED STREET CDATA #IMPLIED SHIPPING CDATA #IMPLIED> <!ELEMENT NOTES (#PCDATA)>
XML4.xml
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE CATALOG SYSTEM "XML4.dtd"> <CATALOG> <PRODUCT NAME="C'estbon" CATEGORY="Shop-Professional" INVENTORY="Backordered" PARTNUM="10" PLANT="Chicago"> <SPECIFICATIONS POWER="0" WEIGHT="555ml">SPECIFICATIONS</SPECIFICATIONS> <OPTIONS>OPTIONS</OPTIONS> <PRICE>2</PRICE> <NOTES>NOTES</NOTES> </PRODUCT> </CATALOG>
以上就是DTD详解的内容,更多相关内容请关注PHP中文网(www.php.cn)!