欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

如何通过IBM DB2 for Linux、UNIX和Windows支持250000次SQL查询

程序员文章站 2022-06-10 11:24:22
...

2011 年的黑色星期五,美国顶尖零售商如何通过 IBM DB2 for Linux、UNIX 和 Windows 每秒钟成功支持 250,000 次 SQL 查询。 黑色星期五(美国感恩节过后的星期五)是零售商一年之中最繁忙的一天。这一天之后紧跟着网络星期一和另外几天活动高峰期。在此期间

2011 年的黑色星期五,美国顶尖零售商如何通过 IBM DB2 for Linux、UNIX 和 Windows 每秒钟成功支持 250,000 次 SQL 查询。

黑色星期五(美国感恩节过后的星期五)是零售商一年之中最繁忙的一天。这一天之后紧跟着网络星期一和另外几天活动高峰期。在此期间,零售商的网站性能对于全年盈利至关重要。几大领先零售商纷纷选用 IBM® Commerce Server、IBM DB2® for Linux、UNIX and Windows (LUW) 为其电子商务引擎提供技术支持,能够为他们服务我感到非常幸运。

提供卓越的交易性能至关重要,但由于很多零售商明白高性能可能意味着需要支付高费用。零售商如何在降低潜在高交易费用的同时,最大限度地提高性能?

有一种方法能够辨别成本削减领域,我已经为这些杰出企业提供指导和支持长达数年之久。采用这项建议的公司纷纷获得了巨大的成功,而这里的重点是电子商务,原则具有普遍适用性,适用于所有在线事务处理 (OLTP) ,包括 SAP、Siebel、PeopleSoft 和 Manhattan Associates,另外还适用于自主开发应用程序以及其他许多应用程序。

按照自己的方式操作

您的 DB2 LUW 具有一定的处理能力,或许这很像您的个人预算。您必须按照自己的方式生活,您的必须在能力范围内运行。为了在有限的能力范围内兴旺发展,您必须控制自己的成本。很显然,您无法印刷钞票,这种做法不合法,并且我也不主张投入更多资金购买更多的硬件,因为性能问题不可能通过购买额外的硬件得到彻底解决(至少需要控制在合理的费用范围内)。

降低成本 = 提高利润

这将会得出一个最基本的道理:您需要重点控制 DB2 的内部执行成本。许多用户希望采用 db2top、db2pd 或其他产品并考察价格。价格可能非常有趣,但却并不十分有用,因为价格可能会因为用户数量、时间段或业务周期而存在很大的差异。

另一方面,在未进行重大调整的情况下,费用相对恒定。无论是 100 名用户还是 10,000 名用户都没有关系,产品查询事务将会执行一定数量的 SQL 语句,这些 SQL 语句将带动一定数量的逻辑和物理 I/O 操作,同时消耗 CPU 周期。虽然您可以通过扩大缓冲池和 SORTHEAP 内存来避免 I/O 操作,但内存中的页面逻辑 I/O 仍会消耗宝贵的 CPU 周期。

那么,如何才能降低 CPU 成本呢?

发现问题只是成功的一半

中国古语有云,“一旦明确说明了问题,问题也就解决了一半。”如果您希望 OLTP 电子商务应用程序能够以最快的速度运行,那么您需要准确回答下面这项紧要问题“哪项开支最大?”只有了解最高执行成本出现在哪儿,您才能采取一些措施来降低这些成本。

无可逃避

降低成本包括进行物理设计调整。具体而言,必须根据事务工作负载需求来创建、调整或放弃索引。不要试图将索引设计问题隐藏在巨大的缓冲池背后,这种做法只会耗尽您的 CPU 容量,而锁定遗留问题仍然存在。随着服务器 CPU 利用率开始超过 90%,事务响应时间可能会十分迅速地下降。CPU 利用率需要得到妥善管理,因此问题就变成了:您应当尽量避免哪些会消耗 CPU 时间的环节?

应对高成本问题的关键

我曾帮助过一家*美国零售商降低成本,我们通过辨别以下四个领域的潜在问题来实现此目标:
 热点:这些数据库表消耗最高的读取 I/O 成本。目前面临的挑战在于,找出这些费用代表了哪一部分的数据库读取 I/O。
 痛点:要找到痛点,请寻找成本最高的 SQL 语句,在综合汇总过程中,这会促使读取 I/O 进入热点表。
 麻烦制造者:这些表已经承受了最高写入 I/O。在这些表中,每个表上哪些是已定义的索引,哪些表拥有较低的基数?
 双重麻烦:如果这些表正在遭受过度溢出访问,则需要进行重组。
通过专心处理这些领域,零售商取得了一些令人印象深刻的成果。让我们分别研究每个领域。

热点

由于索引是在表上创建的,所以索引被设计为降低事务处理成本的主要解决方案,您必须查看表 I/O。要确定数据库事务的平均表 I/O 成本,请用每个表的 ROWS_READ 除以 (COMMITS_ATTEMPTED + ROLLBACKS_ATTEMPTED)。您的电子商务网站必须在高峰期提供出色的性能,每个表的读取 I/O 成本应当小于 10。如果成本不小于 10,那么要么会遗漏索引,要么需要改进索引。您还可以计算每个表的读取行数比例,只需用 ROWS_READ 除以所有表的全部 ROWS_READ 的总和,然后用得出的数值乘以 100。如果任何表出现高比例且 I/O 成本大于 10,那么说明您已经“明确说明了问题”,问题也就解决了一半。

但是,痛点、麻烦制造者和双重麻烦又分别代表着什么?本文的第 2 部分将对影响成本的其他三个关键领域进行探讨。