DB2中两种语言:SQL/XML和XQuery的使用
DB2 9 引入了 pureXML 支持,这意味着 XML 数据是以其自身固有的分层格式进行存储和查询的。为了查询 XML 数据,DB2 提供了两种语言:SQL/XML 和 XQuery。
您可以单独使用 XQuery 和 SQL,但也可将 XQuery 嵌入 SQL 中使用(反之亦可)。每一种可选方案在特定环境下都非常有用。本文将讨论这些可选方案,介绍其各自的优缺点,并给出根据您的需求选择恰当方案的指导原则。
DB2 中的 pureXML 支持为管理 XML 数据提供了高效且通用的功能。DB2 以 XML 数据自身固有的分层格式存储和处理这些数据,避免因为将 XML 存储为 CLOB 中的文本或将它映射为关系表而导致的性能和灵活性限制。与仅使用 XML 的不同,DB2 V9 还提供了关系型数据与 XML 数据在中的无缝集成 —— 甚至是表的某一行中的集成。这样的灵活性表现在语言支持中,使您可访问关系型数据、XML 数据,或者同时访问这两种数据。您可以通过以下四种可选方案中的任一种查询 XML:
- 普通 SQL(不包含 XQuery)
- SQL/XML,即嵌入了 XQuery 的 SQL
- XQuery 作为独立语言(不包含 SQL)
- 嵌入了 SQL 的 XQuery
本文假设您已经熟悉这两篇文章中介绍的基本概念。请注意,XPath 是 XQuery 的一种子语言,因此我们提到 XQuery 时,也暗中包含 XPath 语言。如果您使用过 DB2 XML Extender 中的 XSLT 样式表或位置路径,那么您应该已经了解 XPath。在很多时候,使用 XPath 足以提取 XML 值或表示 XML 谓词,因此,即便您还不熟悉 XQuery 的所有其他特性,也可以开始使用 XPath。
DB2 使您能够利用所有这些可选方案最大限度地提高生产力、使查询适应应用程序的需求。本文将说明的问题如下:
- 这四种可选方案的关键特征是什么?各有哪些优缺点?
- 您应该在哪种情况下选择哪种方案?
让我们先给出一个高度总结,然后再详细研究各个可选方案的细节和特定实例。
总结与指导原则
您可以在普通 XQuery、SQL/XML 或具有内置 SQL 的 XQuery 中表达许多查询。在特定情况下,您可能会发现其中之一能够比其他方案更为直观地表达您的查询逻辑。一般而言,查询 XML 的 “正确” 途径需要在 “逐个处理” 的基础上加以选择,需要考虑应用程序的具体需求和特征。但我们可总结出以下指导原则。
- 不带任何 XQuery 或 XPath 的普通 SQL 仅对全文档检索以及整个文档的插入、删除、更新操作有用。文档的选择必须基于同一表中的非 XML 列。
- 带有嵌入在 SQL 内的 XQuery 或 XPath 语句的 SQL/XML 提供了最广泛的功能性和最少的局限性。您可在 XML 列上表示谓词、提取文档片段、向 XQuery 表达式传递参数标记、使用全文本搜索、SQL 级聚集与分组,您还可以用一种灵活的方式将关系型数据与 XML 数据进行联合和连接。这种方案可很好地服务于绝大多数应用程序。即便您不是立即需要利用所有这些优势,可能仍然会考虑选择这种方案,从而使您的选择能够应对未来的扩展。
- XQuery 是一种强大的查询语言,专为查询 XML 数据而设计。同样,如果您的应用程序只需查询和操纵 XML 数据,且不涉及任何关系型数据,那么 XQuery 也是一种极为出色的选择方案。此方案有时可能较为简单直观。此外,如果您正从一个仅使用 XML 的数据库移植到 DB2 9,且已有 XQuery,那么您很可能愿意继续使用 XQuery。
- 嵌入了 SQL 的 XQuery 在您希望利用关系型谓词和索引同时又想利用全文本搜索预先过滤随后将作为 XQuery 输入的 XML 列中的文档时不失为明智之选。嵌入在 XQuery 中的 SQL 允许您在 XML 列上运行外部函数。但若您需要执行带有分组和聚集的数据分析查询,那么 SQL/XML 是更好的选择。
无论您选择在一条语句中怎样结合 SQL 和 XQuery,DB2 都使用一种混合编译器来为整个查询生成及优化一种执行规划 —— 不会导致查询执行的性能损失。
下表总结了查询 XML 数据的四种不同可选方案的各自优点。
表 1. 总结
普通 SQL | SQL/XML | 普通 XQuery | 嵌入了 SQL/XML 的 XQuery | |
---|---|---|---|---|
XML 谓词 | - | ++ | ++ | ++ |
关系谓词 | ++ | ++ | - | + |
XML 及关系谓词 | - | ++ | - | ++ |
将 XML 与关系型相连接 | - | ++ | - | ++ |
将 XML 与 XML 相连接 | - | + | ++ | ++ |
转换 XML 数据 | - | o | ++ | ++ |
插入、更新和删除 | ++ | ++ | - | - |
参数标记 | + | ++ | - | - |
全文本搜索 | + | ++ | - | ++ |
XML 聚集与分组 | - | ++ | o | o |
函数调用 | ++ | ++ | - | ++ |
在上表中,“-” 表示给定语言不支持某项特性;“+” 表示支持此特性,但存在更有效或更便捷的方式;“++” 表示给定语言极为适合表现该特性;最后,“o” 表示尽管可表现此特性,但从某种程度上来说,效果非常糟糕或者效率很低。
现在,让我们来定义一些示例数据和表,以查看具体的查询示例。
上一篇: windows文件夹太大清理方法是什么
下一篇: 微机上广泛使用的windows是什么