欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

XML指南——XML 语法

程序员文章站 2022-06-19 13:39:07
   xml的语法规则既简单又严格,非常容易学习和使用。 正因为如此,编写读取和操作xml的软件也是相对容易的事情。 一个xml文档的例子 xml文...
  
xml的语法规则既简单又严格,非常容易学习和使用。
正因为如此,编写读取和操作xml的软件也是相对容易的事情。



一个xml文档的例子
xml文档使用了自描述的和简单的语法。
<?xml version="1.0" encoding="iso-8859-1"?>
<note>
<to>lin</to>
<from>ordm</from>
<heading>reminder</heading>
<body>don't forget me this weekend!</body>
</note>


文档的第1行:xml声明——定义此文档所遵循的xml标准的版本,在这个例子里是1.0版本的标准,使用的是iso-8859-1 (latin-1/west european)字符集。
文档的第2行是根元素(就象是说“这篇文档是一个便条”): 
<note>


文档的第3--6行描述了根元素的四个子节点(to, from, heading,和 body):
<to>lin</to>
<from>ordm</from>
<heading>reminder</heading>
<body>don't forget me this weekend!</body>


文档的最后一行是根元素的结束:
</note>


你能从这个文档中看出这是ordm给lin留的便条么?难道能不承认xml是一种美丽的自描述语言么?



所有的xml文档必须有一个结束标记
在xml文档中, 忽略结束标记是不符合规定的。
在html文档中,一些元素可以是没有结束标记的。下面的代码在html中是完全合法的:
<p>this is a paragraph
<p>this is another paragraph


但是在xml文档中必须要有结束标记,象下面的例子一样:
<p>this is a paragraph</p>
<p>this is another paragraph</p> 


注意: 你可能已经注意到了,上面例子中的第一行并没有结束标记。这不是一个错误。因为xml声明并不是xml文档的一部分,他不是xml元素,也就不应该有结束标记。



xml标记都是大小写敏感的
这与html不一样, xml标记是大小写敏感的。
在xml中, 标记<letter>与标记<letter>是两个不同的标记。
因此在xml文档中开始标记和结束标记的大小写必须保持一致。
<message>this is incorrect</message>   //错误的
<message>this is correct</message>     //正确的





所有的xml元素必须合理包含
在xml中不允许不正确的嵌套包含。
在html中,允许有一些不正确的包含,例如下面的代码可以被浏览器解析:
<b><i>this text is bold and italic</b></i>


在xml中所有元素必须正确的嵌套包含,上面的代码应该这样写:
<b><i>this text is bold and italic</i></b>





所有的xml文档必须有一个根元素
xml文档中的第一个元素就是根元素。
所有xml文档都必须包含一个单独的标记来定义,所有其他元素的都必须成对的在根元素中嵌套。xml文档有且只能有一个根元素。
所有的元素都可以有子元素,子元素必须正确的嵌套在父元素中,下面的代码可以形象的说明:
<root>
<child>
<subchild>.....</subchild>
</child>
</root> 





属性值必须使用引号""
在xml中,元素的属性值没有引号引着是不符合规定的。
如同html一样,xml元素同样也可以拥有属性。xml元素的属性以名字/值成对的出现。xml语法规范要求xml元素属性值必须用引号引着。请看下面的两个例子,第一个是错误的,第二个是正确的。
<?xml version="1.0" encoding="iso-8859-1"?>
<note date=12/11/99>
<to>lin</to>
<from>ordm</from>
<heading>reminder</heading>
<body>don't forget me this weekend!</body>
</note>


<?xml version="1.0" encoding="iso-8859-1"?>
<note date="12/11/99">
<to>tove</to>
<from>jani</from>
<heading>reminder</heading>
<body>don't forget me this weekend!</body>
</note>


第一个文档的错误之处是属性值没有用引号引着。 
正确的写法是: date="12/11/99". 不正确的写法: date=12/11/99.



使用xml,空白将被保留
在xml文档中,空白部分不会被解析器自动删除。
这一点与html是不同的。在html中,这样的一句话:
"hello              my name is ordm"将会被显示成:“hello my name is ordm”,
因为html解析器会自动把句子中的空白部分去掉。



使用xml, cr / lf 被转换为 lf
使用 xml, 新行总是被标识为 lf(line feed,换行)。
你知道打字机是什么么?呵呵,打字机是在上个世纪里使用的一种专门打字的机器。^&^
当你用打字机敲完一行字后,你通常不得不再把打字头移动到纸的左端。 
在windows应用程序中,文本中的新行通常标识为 cr lf (carriage return, line feed,回车,换行)。在unix应用程序中,新行通常标识为 lf。还有一些应用程序只使用cr来表示一个新行。



xml中的注释
在xml中注释的语法基本上和html中的一样。
<!-- 这是一个注释 --> 



xml并没有什么特别的哦
xml确实没有什么特别的地方。他只是一些用尖括号扩在一起的普通的纯文本。
编辑普通文本的软件也可以编辑xml文档。
然而在一个支持xml的应用程序中,xml标记往往对应着特殊的操作,有些标记可能是可见的,而有些标记则可能不会显示出来,而不会有什么特殊的操作。