欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

PostgreSQL Select源码解析

程序员文章站 2024-01-17 21:40:04
...

这张时序图比较大,但是大致上描述了PG 处理简单SQL的大致流程。由客户端发起SQL 语句,PG服务端进程backend接收到语句后,开始执

这张时序图比较大,但是大致上描述了PG 处理简单SQL的大致流程。

由客户端发起SQL 语句,PG服务端进程backend接收到语句后,开始执行exec_simple_query()代码。后面所有方法调用均有exec_simple_query()函数直接或者间接发起。

大体上分为以下几个过程:pg_parse_query()->pg_analyze_and_rewrite()->pg_plan_queries()->… ExecutePlan() … ->pg_report_stat()。

pg_parse_query

只是简单的产生raw parse tree,这个里面不涉及语义检查。只是做语法扫描,是一个Bison parser。

pg_analyze_and_rewrite

这块会进行语义分析,会访问数据库中的对像,需要持有锁。这个过程会将简单的一个select 语句拆分成多个部分,将parse tree转换成query tree。如将整个select语句转换成:from 部分,

where条件部分,,group by 部分,order by 部分以及having 部分等。是任何数据库都需要操作的,并且非常重要的一环。

pg_plan_queries

在这个环节,将根据上面的query tree产生执行计划。这部分核心代码在planner.c中,是PG的Query Optimizer。会根据表和索引的统计信息去计算不同路径的可能代价值,最后选出最优者。

这里先不展开,后面会写文章,专门讲这块,即“PG 的Cost-based Optimizer原理”。

ExecutePlan

执行plan,它会遍历每个节点,以致完成。最后将查询结果返回给客户端。

pg_report_stat

将统计信息发送给collector。比如说表和索引扫描了多少次,返回多少记录等。如果是DML语句,还会有增删除改多少记录的统计信息。原始信息以表为维度,后面汇总到库级别或者实例级别。

这对于健康检查或者监控PG的性能有非常重要的作用。

从下面时序图中,可以看出,每个源码文件的任务非常清晰。

postgres.c: 为backend进程,负责打杂和调度,是与客户端对应的server进程。因为PG是C/S架构的,每个客户端连接到PG后,postmaster都会fork出一个backend进程与之进行交互。

xact.c:是与事务相关的操作。事务的状态标志,隔离级别,是否有嵌套事务等。

utility.c: 语句或者命令的类型,主要包含delete,insert,update,select,explain,create,alter等。

execMain.c:是执行语句的总调度入口。

pgstat.c:负责数据库统计收集和展示。

portalmem.c:负责语句执行时,内存申请与释放。PG中,专门取了一个名字叫portal,相当于workspace。

PostgreSQL Select源码解析

------------------------------------华丽丽的分割线------------------------------------

CentOS 6.3环境下yum安装PostgreSQL 9.3

PostgreSQL缓存详述

Windows平台编译 PostgreSQL

Ubuntu下LAPP(Linux+Apache+PostgreSQL+PHP)环境的配置与安装

Ubuntu上的phppgAdmin安装及配置

CentOS平台下安装PostgreSQL9.3

PostgreSQL配置Streaming Replication集群

如何在CentOS 7/6.5/6.4 下安装PostgreSQL 9.3 与 phpPgAdmin

------------------------------------华丽丽的分割线------------------------------------

PostgreSQL 的详细介绍:请点这里
PostgreSQL 的下载地址:请点这里

本文永久更新链接地址