XML简易教程之一
在intel的早期,andy grove遇到一个雇员 - 他
建议公司在芯片的基础上开发个人计算机。andy
grove疑问道“个人计算机能做什么呢?”,这个
雇员举例说,它可以存储处方。grove考虑到整个
研究、开发和市场费用要数百万美圆,最终决定
以为红绿灯提供芯片作为开始。
每个人都是事后诸葛亮。andy grove,不管你怎样看他,被普遍
认为是一个非常聪明的人 - 能够做出发展公司的重大决定。但
是在七十年代,不可能强求他预见到个人计算机的潜力。如果
他当时见过excel、quark、photoshop、oracle或者网络,他就会
理解把强大的处理器放在桌面上会允许软件做任何事。
但是如果没亲眼见过,谁能想到呢。在用打字机、加法机和铅
笔作为计算的工具的时代,你能解释pc和它的用途吗?
这个例子可以用在解释扩展标记语言(xml - extensible markup
language)上。现在还没有和它相似的东西,所以很难做出比
较。你可能听说过xml是html的替代物或xml与html相似,可以
定义自己的标记符。这两种说法都不全对,就象说pc是存储处
方的机器一样。
我妈妈是一个训练有素的厨师,如果我用她的配方,我的家庭
会省下很大一笔钱。
我以简单的开始。因此我打开文本编辑器,开始写一些html
代码:
<html>
<h1 align=center>recipe</h1>
<font face size=2>chocolate chip bars</font>
在写完上面几行后,我想接着写我妈妈 的精妙菜谱。那么怎么
做呢?一份老式的web页面。接下来呢?把我的页面的url送给
对这个菜谱感兴趣的人们,然后让他们剥掉其中的<p>和<font
face size=2>吗?这得花些时间,我想得到实际的内容。
看看下面可能的xml标记:
<author>carol schmidt</author>
<recipe_name>chocolate chip bars</recipe_name>
在xml中,标记符可以最好地描述内容。以这种方式,我可以肯
定任何查找出现在<recipe_name>标记符中的“chocolate chip”
的人都可以得到妈妈_的菜谱。进一步说,如果我的信息被象这
样的标记符(有意义的标记符)包围 - 我可以告诉其它程序如
何使用它们。我还可以通过编码把<recipe_name>标记符中的内
容放入数据库的某个域中,然后把它输出到一本书的硬拷贝中。
还有,我可以用一个支持xml的字处理器使网页的出版轻而易举。
这就是xml的本质:使标记对人和机器都可读。但是在实现这个
目标之前,应该理解用xml编码所涉及的东西。
文档要组织良好
一个xml文件必须满足两点:组织良好和有效。我们以一个组
织良好的文档开始。
我发明了一些描述菜谱的标记符,并把它们组织成一种合理
和可读的方式。它可能不是最好的标记,但是在下面的例子
中工作得很好。
<?xml version="1.0"?>
<list>
<recipe>
<author>carol schmidt</author>
<recipe_name>chocolate chip bars</recipe_name>
<meal>dinner
<course>dessert</course>
</meal>
<ingredients>
<item>2/3 c butter</item>
<item>2 c brown sugar</item>
<item>1 tsp vanilla</item>
<item>1 3/4 c unsifted all-purpose flour</item>
<item>1 1/2 tsp baking powder</item>
<item>1/2 tsp salt</item>
<item>3 eggs</item>
<item>1/2 c chopped nuts</item>
<item>2 cups (12-oz pkg.) semi-sweet choc. chips</item>
</ingredients>
<directions>
preheat oven to 350 degrees. melt butter;
combine with brown sugar and vanilla in large mixing bowl.
set aside to cool. combine flour, baking powder, and salt;
set aside.add eggs to cooled sugar mixture; beat well.
stir in reserved dryingredients, nuts, and chips.
spread in greased 13-by-9-inch pan.
bake for 25 to 30 minutes until goldenbrown;
cool. cut into squares.
</directions>
</recipe>
</list>
这就是一份可以接受的xml文档 - 告诉你xml是什么:把数据
以一种有实际意义的方式进行组织。
虽然这些标记符看起来有点象html,但是有很大的区别:文件
中没有指出数据如何表示的信息。版面指令,当我们准备好时,
就会从其它地方出现。这和把地址簿的信息放在数据库的字段
和记录中而不是放在字处理器产生的清单中的道理一样。数据
库可以让你把地址簿中的信息合成到标签、信封、信件或其它
任何想要的载体上面。最后,就是把这份菜谱文件合成到一种
表现语言中,如html或css。
前面说过,xml文档必须组织良好。这意味着文件必须满足以下
三项基本规则:
文档以xml定义<?xml version="1.0"?>开始。
有一个包含所有其它内容的根元素,如上面例子中的<list>
和</list>标记符。
所有元素必须合理地嵌套,不允许交叉嵌套。
上面的例子中,几个<item>元素被合理地嵌套<ingredients>和
</ingredients>标记符中。但是下面的标记却有严重的问题:
<ingredients><item></ingredients>chocolate chips</item>
于是"chocolate chips"没有被包含在ingredients清单中。因此
这份文档就没有组织好。这在html中可能不算什么,因为浏览器
已经被设计成可以处理这种问题。
但是在xml中却是致命的 - 应用程序将拒绝处理没有组织好的
文件。
我们现在知道组织良好非常重要,但是还不止这些
上一篇: C++构造函数的一些注意事项总结
下一篇: 学习使用XML引擎XQEngine