欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

2018.5.14 XML文档类型定义----DTD

程序员文章站 2022-05-30 12:29:03
...

1.DTD概述

一个完全意义上的XML文件不仅仅是Well-fromed(格式良好的),而且还应该是使用了一些自定义的标记ValidatingXMl(有效的)文档也就是说他必须遵守文档类型的定义中已声明的中中规定。

文档类型定义,DTD用例描述XML文档结构。dtd定义了XML文档中可用的合法元素,可以使用DTD制定可以在文档中存在的元素.

2.为什么要使用DTD文件呢?

因为它满足了网络共享和数据交互。数据存储方便。比如两个相同行业不同地区的人使用同一个DTD文件作为文档的创建规范,那么他们就很容易实现数据共享。网上有人想补充数据根据公用的DTD规范来建立就能立刻加入。

3.DTD声明


DOCTYPE声明有以下部分组成:关键字、文档的根元素名称、可选的外部标识符以及可选的标记声明块,外部标识符用与外部DTD的明明和定位,标记声明快构成的。


XML声明可以有standalone属性,该属性可以有以下两个值yes或no如果是yes说明文档实例没有会影响到传递给应用程序的文档信息的外部声明。

4.DTD声明的位置--------内部DTD


定义的语法‘’

<!DOCTYPE element-name(根元素名)  [
元素描述
.......
]>

XML文档中的数据区的内容


<!DOCTYPE :  表示开始设定DTD,注意DOCTYPE是大写  
element-name:指定此DTD的根元素的名称,一个XML文件只能由一个根元素。
[.........]: 在括号内标记定义XML文件使用的元素,然后使用>结束DTD定义,因此内部含有的定义>

例子

<?xml version="1.0" encoding="GB2312"?>
<!DOCTYPE myfile [
<!ELEMENT myfile (title,author)>  <!--如果没有这句话就会报错character is grammatically unexpected-->
<!ELEMENT title (#PCDATA)>
<!ELEMENT author (#PCDATA)> 
]>
<myfile>
    <title>XML基础教程</title>
    <author>张三</author>
</myfile>

5.DTD声明位置----外部DTD

外部DTD是一个独立于XML文件的文件,实际上也是一个文本文件,只是使用.dtd为为文件的扩展名。由于外部DTD独立于XMl文件,因此他可以提供多个XMl文件使用,就像用同一个模板可以写出多个不同内容的文件一样,这多个XML文件因为是引用同一个外部DTD,所以他们的额大致结构相同。

外部DTD的好处就是:他可以方便高校的被多个XML文档共享。

声明的格式:<!DOCTYPE type-of-doc SYSTEM/PUBLIC “dtd-name”>

说明:
        !DOCTYPE   指要定义一个DOCTYPE

        type-of-doc   是文档类型的名称,有用户自己定义,通常   与使用这个DTD文件的XML文档的根元素名称一致。
        SYSTEM/PUBLIC  这两个参数只用其一,SYSTEM是指文档使用的是私有的外部DTD文件,这个关键字主要引用于通用的DTD
        dtd-name     就是存放dtd文件的地址和名称

DTD文件

<!ELEMENT myfile (title, author)>
<!ELEMENT title  (#PCDATA)>
<!ELEMENT author (#PCDATA)>


引用dtd文件

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE myfile SYSTEM "D:\XML\DTD1.dtd">
<myfile>
    <title>xml文档教程</title> 
    <author>张三</author>
</myfile>

6.DTD语法

元素是XML的核心与灵魂,在DTD中,元素类型是通过ELEMENT标记声明的。除了关键字,标记还提供了所声明类型的名称额内容规范。元素类型名要遵守XML对名称的限制。名乘客也是字母数字下划线组成,但是不能以数字开头;

元素类型声明 ETD (Element Type Declaration) <!ELEMENT element-name element-definition>来声明所有有效的文档元素

说明:
        !ELEMENT  表示开始元素设置,注意此处ELEMENT关键字必须是大写
        element-name   表示要设置的名称的元素的名称
        element-defination  指名要对此元素进行怎样的定义,就是说   <元素 >  </元素>  之间能够包含内容,是其他元素还是一般性的文字

7.XML中按元素的内容可以将元素划分为5类,不同类型的元素使用DTD进行定义时的语法有所不同

```
(1)ANY元素类型
<!ELEMENT 元素名 ANY>

XML文档里该元素中可以包含任何在DTD中定义的元素内容。建议一般只把文档的根元素规定为ANY类型。将根元素设为ANY类型后,元素出现的次数和顺序将不受限制。

(2)EMPTY元素类型
<!ELEMENT 人 EMPTY>

以下的元素是合法的:

下面这个是错的 名为“人”的元素就是非法的,因为此元素因该为空元素,既不能有内容也不能有子元素

匹诺曹人>
匹诺曹爸爸 大人> 人>

(3)#PCDATA 类型的元素(纯文本元素或称简单元素)
可以包含任何字符数据,但是不能包含任何子元素。PCDATA代表字符数据,为了防止与关键字混淆,在前面加个# 语法: <!ELEMENT 元素名 (#PCDATA)>