用PHP与XML联手进行网站编程代码实例
程序员文章站
2022-04-30 13:00:04
一、小序 html简单易学又通用,一般的php程序就是嵌入在html语言之中实现的。但是随着web越来越广泛的应用,html的弱点也越来越明显了。xml的出...
一、小序
html简单易学又通用,一般的php程序就是嵌入在html语言之中实现的。但是随着web越来越广泛的应用,html的弱点也越来越明显了。xml的出现,弥补了这些不足,它提供了一个能够处理互联网上全部数据的通用方法。
二、html的局限性分析
1、 html的可扩展性差。虽然作为一般的应用,html应经够用了,但是在处理数学和化学等符号时,html有明显的缺点,而且它无法进行扩展,这样使它的发展收到了极大的限制。
2、 链路丢失后不能自动纠正。由于web页面的url地址经常改变,而在改变url地址时必须手工修改这些信息,否则就会遇到“404url地址未找到”的信息,这大大加重了web页面的维护工作量。
3、 数据搜索的时间长。由于html主要用来对网页的显示进行控制,导致了同一个数据在不同的网页中有不同的存储格式,这样在进行数据搜索时就无法快速找到所需的资料。
4、 html对双字节或者多国文字的支持不够。例如中文信息页面在不同的平台下会出现无法显示等问题。
正是由于这些缺点,人们研究了能够代替html的web页面制作语言。其中已经投入使用的有:可扩展标记语言xml、层叠样式表(css)以及动态html(dhtml)等。
三、xml的组成
这里简要列举几种主要的xml技术:
1、 dtd(文档类型声明)
dtd的主要功能是定义xml的内容模式;限制xml标记的数据范围;定义属性的数据类型。但由于它不是用xml编写的,因此扩展性比较差;而且只提供了有限的几种数据类型,因此它的作用是有限的。
2、 xml schema
xml schema的作用和dtd类似。但不同的是,schema文件所描述的是引用它的xml文件中的元素和属性的具体类型。另外,由于它是由xml编写的,schema和dtd相比较还有以下优点:
·xml schema内容模型是开放的,可以随意扩充,而dtd无法解析扩充的内容。
·dtd只能把内容类型定义为一个字符串,而xml schema允许把内容类型定义为整型、浮点型、布尔型或者许多其它的简单数据类型。
·xml schema利用namespaces将文档中特殊的节点与schema相联系,一个xml文件可以有多个对应的schema,而一个xml文件只能有一个dtd。
3、 xlink
作为一种web语言,xml的链接能力是非常重要的。xml的链接和定址机制包括xlink、xpath和xpointer。xlink提供功能强大的链接方法,可以在文档之间建立单向或多向的复杂联结关系,还有注释链接、概要链接、扩展链接集等多种链接功能。xpath在xslt和xpointer中使用,支持在xml文档中相对于节点和节点集的定位。xpointer在xpath的基础上提供对xml文档的内容的内部结构(如一个字符串或者选择的一个段落)的定位。xml的链接能力比html有了很大的增强。
4、 css与xsl
xml的一大特点就是内容与格式分离,也就是说,xml文档中并不包含如何显示/表示文档的信息。css与xsl(xml style language)解决了xml文档的显示问题。
css(层叠样式表)也可以用在html和xml中。xsl完全使用xml的语法,功能比css要强大得多。
5、 dom
文档对象模型(dom)是一个与平台、语言无关的程序接口,它提供了动态访问和更新文档的内容、结构与风格的手段。可以对文当作进一步的处理,并将处理的结果更新到表示页面。
dom的目标就是为xml和html定义一个标准的编程接口,它包括核心、html和xml三部分。dom的核心部分建立了一套底层的对象集,它们可以表示任何结构化的文档。html和xml提供了高层的接口,可以作为更方便的文档视图。dom规范由对象和方法组成。程序员使用它们可以更容易地对特定类型的文档进行访问和操作。
6、 namespaces
namespaces是用url加以区别的、在xml文件的元素和属性中出现的所有名称的集合。在xml中,用户可以自己定义标记和元素。因此,如果把多个xml文件合并为一个,就很可能出现冲突。namespaces则解决了这个问题。
四、php对xml的支持
php对xml提供了的强大的支持。它使用了一个xml的“解析器”,并且为了支持这个解析器,它提供了20(php4)个xml的解析函数。下面是几个最常用的php解析函数。
1. xml_parse
boolean xml_parse(int parser, string data, int [isfinal]);
本函数用来解析 xml 格式的文件资料。参数 parser 为解析代码。参数 data 为解析的资料区块 (chunk)。参数 isfinal 可省略,若设为 true 则系统会自动送出最后的资料部分 (piece) 给 data 参数。若无错误则返回 true 值。
2. xml_parser_create
int xml_parser_create(string [encoding]);
本函数用来初始化一个新的 xml 解析器。参数 encoding 可省略,为 xml 使用的字符集,默认值为 iso-8859-1,其它尚有 us-ascii、utf-8 二种。成功则返回 parser 代码供其它函数使用,失败则返回 false 值。
3. xml_set_element_handler
boolean xml_set_element_handler(int parser, string startelementhandler, string endelementhandler);
本函数配置元素的标头供 xml_parse() 函数使用。参数 parser 为解析代码。参数 startelementhandler 及 endelementhandler 分别为元素开始与结束的标头,其中的 startelementhandler 必须包括解析代码、名称、与属性,而 endelementhandler 参数包括了解析代码及名称二个参数。若无错误则返回 true 值。
4. xml_set_character_data_handler
boolean xml_set_character_data_handler(int parser, string handler);
本函数配置字符资料的标头。参数 parser 为解析代码。参数 handler 包括解析代码及资料字符串等二个元素。若无错误则返回 true 值。
5. xml_get_error_code
int xml_get_error_code(int parser);
本函数可取得 xml 在处理时的错误代码。参数 parser 为解析代码。若 parser 有错则返回 false 值,否则就返回错误代码 (如 xml_error_binary_entity_ref .... 等等)。
6. xml_error_string
string xml_error_string(int code);
本函数可取得 xml 在处理时的错误代码。参数 code 为解析错误代码。若无错误返回值为代码的文字描述字符串。
7. xml_get_current_line_number
int xml_get_current_line_number(int parser);
本函数用来取得目前 xml 解析所正在处理的行号。参数 parser 为解析代码。若 parser 有错则返回 false 值,若无错误则返回行号数字。
8. xml_parser_free
boolean xml_parser_free(int parser);
本函数用来释放目前 xml 解析所使用的内存。参数 parser 为解析代码。若没有错误则返回 true 值,否则返回 false 值。
html简单易学又通用,一般的php程序就是嵌入在html语言之中实现的。但是随着web越来越广泛的应用,html的弱点也越来越明显了。xml的出现,弥补了这些不足,它提供了一个能够处理互联网上全部数据的通用方法。
二、html的局限性分析
1、 html的可扩展性差。虽然作为一般的应用,html应经够用了,但是在处理数学和化学等符号时,html有明显的缺点,而且它无法进行扩展,这样使它的发展收到了极大的限制。
2、 链路丢失后不能自动纠正。由于web页面的url地址经常改变,而在改变url地址时必须手工修改这些信息,否则就会遇到“404url地址未找到”的信息,这大大加重了web页面的维护工作量。
3、 数据搜索的时间长。由于html主要用来对网页的显示进行控制,导致了同一个数据在不同的网页中有不同的存储格式,这样在进行数据搜索时就无法快速找到所需的资料。
4、 html对双字节或者多国文字的支持不够。例如中文信息页面在不同的平台下会出现无法显示等问题。
正是由于这些缺点,人们研究了能够代替html的web页面制作语言。其中已经投入使用的有:可扩展标记语言xml、层叠样式表(css)以及动态html(dhtml)等。
三、xml的组成
这里简要列举几种主要的xml技术:
1、 dtd(文档类型声明)
dtd的主要功能是定义xml的内容模式;限制xml标记的数据范围;定义属性的数据类型。但由于它不是用xml编写的,因此扩展性比较差;而且只提供了有限的几种数据类型,因此它的作用是有限的。
2、 xml schema
xml schema的作用和dtd类似。但不同的是,schema文件所描述的是引用它的xml文件中的元素和属性的具体类型。另外,由于它是由xml编写的,schema和dtd相比较还有以下优点:
·xml schema内容模型是开放的,可以随意扩充,而dtd无法解析扩充的内容。
·dtd只能把内容类型定义为一个字符串,而xml schema允许把内容类型定义为整型、浮点型、布尔型或者许多其它的简单数据类型。
·xml schema利用namespaces将文档中特殊的节点与schema相联系,一个xml文件可以有多个对应的schema,而一个xml文件只能有一个dtd。
3、 xlink
作为一种web语言,xml的链接能力是非常重要的。xml的链接和定址机制包括xlink、xpath和xpointer。xlink提供功能强大的链接方法,可以在文档之间建立单向或多向的复杂联结关系,还有注释链接、概要链接、扩展链接集等多种链接功能。xpath在xslt和xpointer中使用,支持在xml文档中相对于节点和节点集的定位。xpointer在xpath的基础上提供对xml文档的内容的内部结构(如一个字符串或者选择的一个段落)的定位。xml的链接能力比html有了很大的增强。
4、 css与xsl
xml的一大特点就是内容与格式分离,也就是说,xml文档中并不包含如何显示/表示文档的信息。css与xsl(xml style language)解决了xml文档的显示问题。
css(层叠样式表)也可以用在html和xml中。xsl完全使用xml的语法,功能比css要强大得多。
5、 dom
文档对象模型(dom)是一个与平台、语言无关的程序接口,它提供了动态访问和更新文档的内容、结构与风格的手段。可以对文当作进一步的处理,并将处理的结果更新到表示页面。
dom的目标就是为xml和html定义一个标准的编程接口,它包括核心、html和xml三部分。dom的核心部分建立了一套底层的对象集,它们可以表示任何结构化的文档。html和xml提供了高层的接口,可以作为更方便的文档视图。dom规范由对象和方法组成。程序员使用它们可以更容易地对特定类型的文档进行访问和操作。
6、 namespaces
namespaces是用url加以区别的、在xml文件的元素和属性中出现的所有名称的集合。在xml中,用户可以自己定义标记和元素。因此,如果把多个xml文件合并为一个,就很可能出现冲突。namespaces则解决了这个问题。
四、php对xml的支持
php对xml提供了的强大的支持。它使用了一个xml的“解析器”,并且为了支持这个解析器,它提供了20(php4)个xml的解析函数。下面是几个最常用的php解析函数。
1. xml_parse
boolean xml_parse(int parser, string data, int [isfinal]);
本函数用来解析 xml 格式的文件资料。参数 parser 为解析代码。参数 data 为解析的资料区块 (chunk)。参数 isfinal 可省略,若设为 true 则系统会自动送出最后的资料部分 (piece) 给 data 参数。若无错误则返回 true 值。
2. xml_parser_create
int xml_parser_create(string [encoding]);
本函数用来初始化一个新的 xml 解析器。参数 encoding 可省略,为 xml 使用的字符集,默认值为 iso-8859-1,其它尚有 us-ascii、utf-8 二种。成功则返回 parser 代码供其它函数使用,失败则返回 false 值。
3. xml_set_element_handler
boolean xml_set_element_handler(int parser, string startelementhandler, string endelementhandler);
本函数配置元素的标头供 xml_parse() 函数使用。参数 parser 为解析代码。参数 startelementhandler 及 endelementhandler 分别为元素开始与结束的标头,其中的 startelementhandler 必须包括解析代码、名称、与属性,而 endelementhandler 参数包括了解析代码及名称二个参数。若无错误则返回 true 值。
4. xml_set_character_data_handler
boolean xml_set_character_data_handler(int parser, string handler);
本函数配置字符资料的标头。参数 parser 为解析代码。参数 handler 包括解析代码及资料字符串等二个元素。若无错误则返回 true 值。
5. xml_get_error_code
int xml_get_error_code(int parser);
本函数可取得 xml 在处理时的错误代码。参数 parser 为解析代码。若 parser 有错则返回 false 值,否则就返回错误代码 (如 xml_error_binary_entity_ref .... 等等)。
6. xml_error_string
string xml_error_string(int code);
本函数可取得 xml 在处理时的错误代码。参数 code 为解析错误代码。若无错误返回值为代码的文字描述字符串。
7. xml_get_current_line_number
int xml_get_current_line_number(int parser);
本函数用来取得目前 xml 解析所正在处理的行号。参数 parser 为解析代码。若 parser 有错则返回 false 值,若无错误则返回行号数字。
8. xml_parser_free
boolean xml_parser_free(int parser);
本函数用来释放目前 xml 解析所使用的内存。参数 parser 为解析代码。若没有错误则返回 true 值,否则返回 false 值。