关于PHP工具包expat解析XML揭秘
下面我会给读者演示一个简单的示例,通过这个例子即可说明如何用PHP工具包把XML文档解析为HTML。然后我会介绍一些PHP的其他XML概念。用PHP工具包解析 XML很简单,操作起来很直观但却需要对细节有所解释。一旦真正掌握了应用的要领,你肯定会惊奇自己怎么不早想到把它们俩拢一块儿来。
概述
PHP 用expat这种XML工具包,通过C语言来解析XML。这个工具包的函数集同Perl XML解析所采用的函数集是一样的,此外,这种工具包还是事件驱动型的解析器。这就是说,expat把每个XML标签或者新一行代码当作事件的起始,而事件就是函数的触发器。Expat的安装非常简单,如果你正在用着Apache Web服务器,那么你可以在PHP XML参考页上找到安装和下载指南。
用PHP解析XML的基本任务是这样的:首先,创建XML解析器的一个实例。接着,定义处理触发事件的函数,比如开始或者结束标签等。随后,定义实际意义的数据处理程序。最后,打开XML文件,读取文件数据并解析数据。之后关闭文件释放XML解析器。
你瞧,就像我说的那样,这套操作过程没什么特别的。不过,在我们讨论具体的示例之前先了解以下的一些警示:Expat不对XML进行检验。这意味着只要XML文件格式正确——所有的元素嵌套得当、开始和关闭标签没有任何错误——它就会被解析。Expat可不管XML是否遵守XML文件头中引用的标准或者定义。Expat把XML标签全部转换为大写字母。如果你的脚本在标签名和其他内容上大小写字母混用可就要小心了。PHP是在magic quotes设置启用的情况下编译而成,那么复杂的XML文件不会得到正确的解析。要是magic quotes不是默认设置,你就当我没说。
基本示例
为了把复杂的事情简单化,我在例子中省略了错误检查和其他一些不必要的东西,当然,你可以在自己的代码随心所欲。我假定你早就熟悉PHP及其语法,而我会对 XML函数做一番解释。首先我会说明脚本程序的含义,接着定义用户定义函数,实际上这些函数位于引用它们的代码之前。相关附件:程序清单A 所示为脚本的完整代码,脚本要解析的XML文档则是 相关附件:程序清单B。处理之后的输出结果如表A所示。
- XML Articles
- "Remedial XML for programmers: Basic syntax"
- In this first installment in a three-part series,
- I'll introduce you to XML and its basic syntax.
- "Remedial XML: Enforcing document formats with DTDs"
- To enforce structure requirements for an XML document, you have to turn to one of XML's attendant technologies, data type definition (DTD).
- "Remedial XML: Using XML Schema"
- In this article, we'll briefly touch on the shortcomings of DTDs and discuss the basics of a newer, more powerful standard: XML Schemas.
- "Remedial XML: Say hello to DOM"
- Now it's time to put on your programmer's hat and get acquainted with Document Object Model (DOM),
- which provides easy access to XML documents via a tree-like set of objects.
- "Remedial XML: Learning to play SAX"
- In this fifth installment in our Remedial XML series, I'll introduce you to the SAX API and provide some links to
SAX implementations in several languages.