MySQL源码探索02SQL命令总体执行流程
本文将在mysql源码探索系列技术博客的第1篇的基础上接着分析dispatch_command()函数之后的工作流程,主要是分析mysql_parse()和mysql_execute_command()两个函数的代码框架,并对其中涉及到的隐式事务如何判断等等问题结合mysql源码进行了介绍。
本人技术博客网址:
https://www.cnblogs.com/coe2coe/
其中可以找到mysql源码探索系列博客和mysql其它系列博客,以及其它相关的技术系列的博客。
1.mysql_parse
前面已经看到了mysql服务器接收到sql命令后最终到了dispatch_command()函数中进行处理。dispatch_command()的核心功能是调用了mysql_parse()函数。
mysql_parse()函数的精简代码如下图所示,为了更加直观的描述这个函数的作用,对代码布局也做了一定的调整。
图1
mysql_parse()的核心功能如下:
(1)判断sql是否在查询缓存中,如果查询缓存命中,则直接发送结果给mysql客户端,同时记录日志,查询过程结束。如果没命中,或者在缓存中但是没权限使用,则执行后续过程进行实际的查询操作。对于查询缓存的具体细节,本文不做展开描述。
(2)解析sql。这个过程实际上使用bison开源框架产生的代码进行语法解析,限于篇幅,本文不做展开描述。如果对如何使用bison和flex开源框架产生语法解析代码这方面的内容感兴趣,可以阅读本人的另一个系列的技术博客:
mysql技术探索01实现sql语法解析器
https://www.cnblogs.com/coe2coe/p/9743701.html
(3)对原始sql语句进行重写。主要作用是防止在日志中出现明文的密码字符串。比如下面的这个sql语句中含有密码,因此将会被rewrite修改。
图2
最终日志中的sql信息如下,其中的密码字符串显示为<secret>。
图3
mysql不会对所有的sql进行rewrite,只会对涉及明文密码的sql进行重写,还有一类比较特殊的sql也会进行重写。这个工作是在mysql_rewrite_query()函数中执行的。mysql_rewrite_query()函数大致内容如下:
图4
(4)记录日志。如果sql进行了rewrite,则将rewrite后的sql语句写入到日志中,否则将原始日志写入到日志中。
执行sql命令。真正执行sql命令,实际调用mysql_execute_command()函数进行执行。稍后具体介绍这个函数。
2.mysql_execute_command
前面提到了mysql_parse()函数调用了mysql_execute_command()函数来执行sql命令,现在来看一下这个函数真正完成的工作有哪些。精简后的代码框架如下图所示:
图5
(1)如果存在需要提交的隐式事务,则提交隐式事务。具体来讲,mysql定义了四种可能需要隐式提交事务的sql命令:
sqlcom_drop_table
sqlcom_alter_table
sqlcom_create_table
sqlcom_set_option
在stmt_causes_implicit_commit()这个函数中做了是否需要隐式提交事务的判断。
(i)对于sqlcom_create_table和sqlcom_alter_table命令,并不是都需要隐式提交事务,对于创建和修改临时表则不需要隐式提交事务。
(ii)对于sqlcom_set_option命令,只有执行set autocommit=1时,则需要隐式提交事务,对于其他的set命令,则不需要。
(iii)对于sqlcom_drop_table命令,当删除一个临时表时,也不需要隐式提交事务。
隐式提交的执行是在trans_commit_implicit()函数中进行的。
(2)隐式提交一个事务不会自动释放已经存在的表锁,在mysql_execute_command()中还调用release_transactional_locks()函数执行了释放元数据锁的操作。元数据锁工作在mysql 的server层,跟innodb 存储引擎层的记录锁、间隙锁以及下一键锁(next-key lock)这些锁相比,元数据锁是完全不同的概念,mysql的表锁就是一种元数据锁,也可以细分为n种类型,在此不详细展开了。
(3)根据不同的sql命令,执行不同的操作。包括创建和删除数据库,创建和删除表,数据的增删改查,以及其它很多的sql命令。全部的sql命令的id在enum_sql_command中定义,后文将列出全部的sql命令id。
(4)关闭当前打开的所有表。这个关闭的操作时在close_thread_tables()函数中进行的。这个函数所做的工作如下图所示:
图6
如果当前语句处在自动提交事务中,则自动提交隐式事务。sql命令执行之后的隐式提交条件的判断条件跟执行之前的判断条件在细微处可能相同,也可能不同。不同之处主要是涉及到一个全局数组变量:
图7
这个变量在init_update_queries()这个函数中做了初始化操作,基本上属于每个sql命令id有一个对应的标志。
前面介绍的判断函数stmt_causes_implicit_commit()在最前面还有以下这个判断:
图8
意思是说,如果mask标志没有包含在命令id对应的标志位掩码中,就认为不需要隐式提交,这个判断确定不需要隐式提交后,就不会再进行前面介绍的临时表相关的判断了。只有这个mask标志符合数组中指定的标志位掩码时,才会继续进行后面的临时表相关判断。
前面介绍的sqlcom_create_table就使用了下面这个标志,说明create table命令不管在sql命令之前还是执行后,判断是相同的。
图9
从当前的mysql源代码来看,前面提到的四个sql命令都使用了cf_auto_commit_trans这个标志位,因此都是在执行前后均需要继续判断。
3.sql命令的id
sql命令的id,在enum_sql_command中定义了。基本上根据id的名字就能猜测出这个sql语句的用途,因此本文不会具体介绍每个sql命令的用途。这里的sql命令的id,和前面博客中介绍的命令交互中的命令的种类,是两个不同层次的概念。前文提出的命令的种类,是高层命令,这里的sql命令的id,是低层命令,更为具体。这里列出的所有id,在命令的种类这个高层次上,都属于一种类型:com_query。
enum enum_sql_command {
sqlcom_select,
sqlcom_create_table,
sqlcom_create_index,
sqlcom_alter_table,
sqlcom_update,
sqlcom_insert,
sqlcom_insert_select,
sqlcom_delete,
sqlcom_truncate,
sqlcom_drop_table,
sqlcom_drop_index,
sqlcom_show_databases,
sqlcom_show_tables,
sqlcom_show_fields,
sqlcom_show_keys,
sqlcom_show_variables,
sqlcom_show_status,
sqlcom_show_engine_logs,
sqlcom_show_engine_status,
sqlcom_show_engine_mutex,
sqlcom_show_processlist,
sqlcom_show_master_stat,
sqlcom_show_slave_stat,
sqlcom_show_grants,
sqlcom_show_create,
sqlcom_show_charsets,
sqlcom_show_collations,
sqlcom_show_create_db,
sqlcom_show_table_status,
sqlcom_show_triggers,
sqlcom_load,
sqlcom_set_option,
sqlcom_lock_tables,
sqlcom_unlock_tables,
sqlcom_grant,
sqlcom_change_db,
sqlcom_create_db,
sqlcom_drop_db,
sqlcom_alter_db,
sqlcom_repair,
sqlcom_replace,
sqlcom_replace_select,
sqlcom_create_function,
sqlcom_drop_function,
sqlcom_revoke,
sqlcom_optimize,
sqlcom_check,
sqlcom_assign_to_keycache,
sqlcom_preload_keys,
sqlcom_flush,
sqlcom_kill,
sqlcom_analyze,
sqlcom_rollback,
sqlcom_rollback_to_savepoint,
sqlcom_commit,
sqlcom_savepoint,
sqlcom_release_savepoint,
sqlcom_slave_start,
sqlcom_slave_stop,
sqlcom_start_group_replication,
sqlcom_stop_group_replication,
sqlcom_begin,
sqlcom_change_master,
sqlcom_change_replication_filter,
sqlcom_rename_table,
sqlcom_reset,
sqlcom_purge,
sqlcom_purge_before,
sqlcom_show_binlogs,
sqlcom_show_open_tables,
sqlcom_ha_open,
sqlcom_ha_close,
sqlcom_ha_read,
sqlcom_show_slave_hosts,
sqlcom_delete_multi,
sqlcom_update_multi,
sqlcom_show_binlog_events,
sqlcom_do,
sqlcom_show_warns,
sqlcom_empty_query,
sqlcom_show_errors,
sqlcom_show_storage_engines,
sqlcom_show_privileges,
sqlcom_help,
sqlcom_create_user,
sqlcom_drop_user,
sqlcom_rename_user,
sqlcom_revoke_all,
sqlcom_checksum,
sqlcom_create_procedure,
sqlcom_create_spfunction,
sqlcom_call,
sqlcom_drop_procedure,
sqlcom_alter_procedure,
sqlcom_alter_function,
sqlcom_show_create_proc,
sqlcom_show_create_func,
sqlcom_show_status_proc,
sqlcom_show_status_func,
sqlcom_prepare,
sqlcom_execute,
sqlcom_deallocate_prepare,
sqlcom_create_view,
sqlcom_drop_view,
sqlcom_create_trigger,
sqlcom_drop_trigger,
sqlcom_xa_start,
sqlcom_xa_end,
sqlcom_xa_prepare,
sqlcom_xa_commit,
sqlcom_xa_rollback,
sqlcom_xa_recover,
sqlcom_show_proc_code,
sqlcom_show_func_code,
sqlcom_alter_tablespace,
sqlcom_install_plugin,
sqlcom_uninstall_plugin,
sqlcom_binlog_base64_event,
sqlcom_show_plugins,
sqlcom_create_server,
sqlcom_drop_server,
sqlcom_alter_server,
sqlcom_create_event,
sqlcom_alter_event,
sqlcom_drop_event,
sqlcom_show_create_event,
sqlcom_show_events,
sqlcom_show_create_trigger,
sqlcom_alter_db_upgrade,
sqlcom_show_profile,
sqlcom_show_profiles,
sqlcom_signal,
sqlcom_resignal,
sqlcom_show_relaylog_events,
sqlcom_get_diagnostics,
sqlcom_alter_user,
sqlcom_explain_other,
sqlcom_show_create_user,
sqlcom_shutdown,
sqlcom_alter_instance,
sqlcom_end
};
4.总结
sql语句的总体执行流程就是这样的。本文关注的主要问题是sql语句的执行过程的总体流程,因此分析到mysql_execute_command()函数这一层就足够了。再往更低层次分析,就涉及到具体的sql语句的类型的区分了,比如select语句肯定和insert语句的具体执行过程是不同的。这种细分显然并不是本文需要关注的主体内容。
至于具体的一个sql语句在更低级的层次上是如何执行的细节问题,以后有机会再对mysql服务器的源码做进一步的探索。
本人技术博客网址:
https://www.cnblogs.com/coe2coe/
其中可以找到mysql源码探索系列博客和mysql其它系列博客,以及其它相关的技术系列的博客。