DTD笔录

程序员文章站 2022-05-29 22:51:04

...

主要内容：

①如何描述 XML 文档的结构；

②如何使用 DTD 来定义一个 XML 文档的合法元素，以及如何在您的 XML 内部或者作为一个外部引用来声明 DTD；

③如何为 XML 文档声明合法的元素、属性、实体以及 CDATA 部分；

④如何根据某个 DTD 来验证一个 XML 文档

（1）简介

DTD（document type defined文档类型定义）的作用是定义 XML 文档的合法构建模块。可被成行地声明于 XML 文档中（内部文档声明），也可作为一个外部引用（外部文档声明）

①内部的 DOCTYPE 声明：

假如 DTD 被包含在您的 XML 源文件中，它应当通过下面的语法包装在一个 DOCTYPE 声明中：

<!DOCTYPE root-element（根元素）[element-declarations（元素声明）]>

②外部文档声明：

假如 DTD 位于 XML 源文件的外部，那么它应通过下面的语法被封装在一个 DOCTYPE 定义中：

<!DOCTYPE root-element（根元素） SYSTEM（系统）"filename">

③作用：

通过 DTD，每一个 XML 文件均可携带一个有关其自身格式的描述；并且独立的团体可一致地使用某个标准的 DTD 来交换数据。

应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据，还可以使用 DTD 来验证您自身的数据。

（2）XML构建模块

XML 和 HTML文档的主要的构建模块是元素标签

①XML 文档构建模块

所有的 XML 文档（以及 HTML 文档）均由以下简单的构建模块构成：元素，属性，实体，PCDATA，CDATA

下面依次解析各个构成：

1 . 元素是 XML 以及 HTML 文档的主要构建模块，元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"；

2 . 属性可提供有关元素的额外信息，且总是被置于某元素的开始标签中；

3 . 实体（实体引用/字符）是用来定义普通文本的变量。实体引用是对实体的引用，当文档被 XML 解析器解析时，实体就会被展开；

4 . PCDATA（parsed character data解析字符数据）是会被解析器解析的文本。

这些文本将被解析器检查实体以及标记，文本中的标签会被当作标记来处理，而实体会被展开。

不过，被解析的字符数据不应当包含任何 &、< 或者 > 字符；需要使用 &、< 以及 > 实体来分别替换它们；

5. CDATA（character data字符数据）是不会被解析器解析的文本，在这些文本中的标签不会被当作标记来对待，其中的实体也不会被展开。

【拓展】

CDATA：属性声明中的类型，就是字符串，&、<、“”和‘’ 等都具有特殊含义被解析，例如："解析为双引号，一般指不由 XML 解析器进行解析的文本数据；

PCDATA：元素声明中的类型，指的是混合类型，即可以包子元素也可包含字符串， &和<也是具有特殊含义被解析。它是XML解析器解析的文本数据使用的一个术语。XML 文档中的文本通常解析为字符数据，或者（按照文档类型定义术语）称为 PCDATA

（3）DTD元素

DTD元素通过元素声明来声明元素

【声明一个元素】

元素声明使用下面的语法：

<!ELEMENT element-name category类别>
或
<!ELEMENT element-name (element-content元素内容)>

1. 空元素：通过类别关键词EMPTY进行声明：

<!ELEMENT element-name EMPTY>
以下为实例:
<!ELEMENT br EMPTY>
XML example:
<br />

2.只有 PCDATA 的元素：通过圆括号中的 #PCDATA 进行声明：

<!ELEMENT element-name (#PCDATA)>
以下为实例:
<!ELEMENT from (#PCDATA)>

3.带有任何内容的元素：通过类别关键词 ANY 声明的元素，可包含任何可解析数据的组合：

<!ELEMENT element-name ANY>
以下为实例:
<!ELEMENT note ANY>

4.带有子元素（序列）的元素：通过圆括号中的子元素名进行声明

<!ELEMENT element-name (child1,child2,...)>
以下为实例:
<!ELEMENT note (to,from,heading,body)>

当子元素按照由逗号分隔开的序列进行声明时，这些子元素必须按照相同的顺序出现在文档中。在一个完整的声明中，子元素也必须被声明，同时子元素也可拥有子元素。"note" 元素的完整声明是：

<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>

5 . 声明只出现一次的元素

<!ELEMENT element-name (child-name)>
以下为实例:
<!ELEMENT note (message)>

上面的例子声明了：message 子元素必须出现一次，并且必须只在 "note" 元素中出现一次

6 . 声明最少出现一次的元素

<!ELEMENT element-name (child-name+)>
以下为实例:
<!ELEMENT note (message+)>

上面的例子中的加号（+）声明了：message 子元素必须在 "note" 元素内出现至少一次

7 . 声明出现零次或多次的元素

<!ELEMENT element-name (child-name*)>
以下为实例:
<!ELEMENT note (message*)>

上面的例子中的星号（*）声明了：子元素 message 可在 "note" 元素内出现零次或多次

8 . 声明出现零次或一次的元素

<!ELEMENT element-name (child-name?)>
以下为实例:
<!ELEMENT note (message?)>

上面的例子中的问号(?)声明了：子元素 message 可在 "note" 元素内出现零次或一次

9 . 声明"非.../既..."类型的内容

<!ELEMENT note (to,from,header,(message|body))>

上面的例子声明了："note" 元素必须包含 "to" 元素、"from" 元素、"header" 元素，以及非 "message" 元素既 "body" 元素

10 . 声明混合型的内容

<!ELEMENT note (#PCDATA|to|from|header|message)*>

上面的例子声明了："note" 元素可包含出现零次或多次的 PCDATA、"to"、"from"、"header" 或者 "message"

（4）DTD属性

在 DTD 中，属性通过 ATTLIST 声明来进行声明

属性声明语法：

<!ATTLIST element-name元素名 attribute-name属性名 attribute-type属性类型 attribute-value>

DTD 实例:

<!ATTLIST payment type CDATA "check">

XML 实例:

<payment type="check" />

（5）XML元素vs属性

在HTML重多使用属性，但在XML中，使用子元素，会感觉更像数据信息

同时要尽量避免使用属性：

一些属性具有以下问题:

属性不能包含多个值（子元素可以）；不容易扩展（为以后需求的变化）；无法描述结构（子元素可以）；更难以操纵程序代码；不容易测试，针对DTD

上面有具体解析

（6）DTD实体

实体是用于定义引用普通文本或特殊字符的快捷方式的变量

实体引用是对实体的引用，可在内部或外部进行声明

内部实体声明：

<!ENTITY entity-name实体名称 "entity-value">
以下为实例
DTD 实例:
<!ENTITY writer "Donald Duck.">
<!ENTITY copyright "Copyright runoob.com">
XML 实例：
<author>&writer;&copyright;</author>

注意：一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)

外部实体声明

<!ENTITY entity-name SYSTEM "URI/URL">
以下为实例
DTD 实例:
<!ENTITY writer SYSTEM "http://www.runoob.com/entities.dtd">
<!ENTITY copyright SYSTEM "http://www.runoob.com/entities.dtd">
XML 例子:
<author>&writer;&copyright;</author>

（7）DTD验证

使用IE可根据某个 DTD 来验证您的 XML

【通过 XML 解析器进行验证】

当试图打开某个 XML 文档时，XML 解析器有可能会产生错误。通过访问 parseError 对象，就可以取回引起错误的确切代码、文本甚至所在的行

注意： load() 方法用于文件，而 loadXML() 方法用于字符串

【关闭验证：通过把 XML 解析器的 validateOnParse 设置为 "false"，就可以关闭验证】

DTD笔录

spring加载xml去远程获取dtd验证xml的问题

JS操作XML中DTD介绍及使用方法分析

MyEclipse中怎么创建xml约束文件DTD?

linux系列之常用运维命令整理笔录(小结)

DTD

Android碎笔录1——基本布局

Android碎笔录3——点击跳转

JS操作XML中DTD介绍及使用方法分析

厦门一手机店被5少年洗劫！官方：已做完笔录、正在调查

Eclipse手动导入DTD文件实现方法解析