欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

面向PHP开发人员的XML 第2部分: 高级XML解析技术

程序员文章站 2022-05-20 19:20:15
...

简介

PHP5 提供了更多的 xml(标准化越来越近了) 解析技术。James Clark 的 Expat SAX 解析器(现在以 libxml(标准化越来越近了)2 为基础)不再是惟一功能完备的解析器。经常需要使用完全符合 W3C 标准的 DOM 解析器进行解析。无论第 1 部分(请参阅 参考资料)介绍的 Simplexml(标准化越来越近了) 还是比 SAX 更简单更快捷的 xml(标准化越来越近了)Reader 都提供了另外的解析方法。所有这些 xml(标准化越来越近了) 扩展现在都以 GNOME 项目的 libxml(标准化越来越近了)2 库为基础。这个统一的库考虑了不同扩展之间的互操作性。本文将介绍 PHP5 xml(标准化越来越近了) 解析技术,特别是大型、复杂 xml(标准化越来越近了) 文档的解析。还介绍了关于解析技术的一些背景知识,何种方法最适合于何种类型的 xml(标准化越来越近了) 文档,如果要作出选择,则应依据何种标准。

Simplexml(标准化越来越近了)

第 1 部分介绍了 xml(标准化越来越近了) 的基本信息,主要介绍简单的、入门级的应用程序编程接口(Application Programming Interfaces,API)。通过例子说明对于处理简单、可预测并且不大的 xml(标准化越来越近了) 文档,Simplexml(标准化越来越近了)(必要的时候与文档对象模型(DOM)结合使用)是一种理想的选择。

xml(标准化越来越近了) 和 PHP5

可扩展标记语言(Extensible Markup Language,xml(标准化越来越近了))不仅被看作是一种标记语言,而且是一种基于文本的数据存储格式,它提供了基于文本的方法来应用和描述信息的树状结构。

PHP5 提供了一些全新的和重新编写的 xml(标准化越来越近了) 解析扩展。其中包括将整个 xml(标准化越来越近了) 文档加载到内存中的 Simplexml(标准化越来越近了)、DOM 和 XSLT 处理程序。也有每次把 xml(标准化越来越近了) 文档的一部分加载到内存中的 Simple API for xml(标准化越来越近了) (SAX) 和 xml(标准化越来越近了)Reader。SAX 的功能和在 PHP4 中没有变化,但不再以 expat 库为基础而改用了 libxml(标准化越来越近了)2 库。如果通过其他语言熟悉了 DOM,则与以前的版本相比,在 PHP5 中使用 DOM 编程将简单得多。

xml(标准化越来越近了) 解析基础

解析 xml(标准化越来越近了) 有两种基本的方式:树和流。树解析方式需要将整个 xml(标准化越来越近了) 文档加载到内存中。树文件结构允许随机访问文档元素和编辑 xml(标准化越来越近了)。树型解析的例子包括 DOM 和 Simplexml(标准化越来越近了)。这些解析器都在内存中以不同但可互操作的格式共享树状结构。和树解析方式不同,流解析不需要将整个文档加载到内存中。这里的流和流音频中的流意思很相近。其用途和目的都一样,就是每次提交少量数据以节约带宽和内存。在流解析中,只能访问当前解析的节点,并且不能将 xml(标准化越来越近了) 作为一个文档来编辑。流解析器的例子包括 xml(标准化越来越近了)Reader 和 SAX。

1 2 3 4 5 6 下一页