MySQL通透详解架构设计
系统只要能从数据库连接池获取到一个数据库连接,就能执行crud。可通过数据库连接将待执行sql发给mysql。
大部分 crud boy只知道:
- 执行insert语句后,在表里会多条数据
- 执行update后,会更改表数据
- 执行delete后,会删除表里数据
- 执行select后,会查询表里数据出来
- 要是sql性能丢人,建几个索引解决
- …
这应该是目前行业内很多工程师对数据库的一个认知,完全当他是个黑盒来建表及执行sql。
网络连接必须有线程处理
假设数据库服务器的连接池中的某个连接,接收到一条sql网络请求,请思考:
- 谁负责从这个连接中去监听网络请求?
- 谁负责从网络连接里把请求数据读取出来?
网络连接得有一个线程来监听请求及读取请求数据,比如从网络连接中读取和解析出来一条业务系统发的sql语句:
sql接口
负责处理接收到的sql语句。
mysql的工作线程从一个网络连接中读出一个sql语句后,会如何执行该sql呢?
mysql提供了sql接口(sql interface),一套执行sql语句的接口,专门执行业务系统发送的那些crud语句
因此mysql的工作线程接收到sql语句之后,就会转交给sql接口去执行:
查询解析器
那sql接口怎么执行sql语句的?这玩意能懂这些sql语句?
假设有如下sql:
select id,name,age from users where id=1
这就需要查询解析器(parser),负责解析sql语句,比如对那个sql拆解成:
- 要从“users”表里查询数据
- 查询“id”字段的值等于1的那行数据
- 对查出来的那行数据要提取里面的“id,name,age”三字段
sql解析也就是按sql语法来解析sql语句意欲何为:
查询优化器
通过解析器知道sql要干啥了,然后就得找查询优化器(optimizer)选择一个最优查询路径。
啥叫最优查询路径呢?
之前的那个sql:从“users”表里查询数据,查“id”字段的值等于1的那行数据,对查出来的那行数据要提取里面的“id,name,age”三个字段。
要完成此事有如下查询路径:
- 直接定位到users表中的id字段等于1的那行数据,查出来那行数据的id、name、age三个字段值
- 先把users表中的每行数据的“id,name,age”三个字段的值都查出来,然后从这批数据里过滤出来“id”字段等于1的那行数据的“id,name,age”三个字段
可见,完成该sql,两条路径都能实现,那到底选哪个呢?显然第一种性能更好。
所以查询优化器大概就是这个意义,他会针对你的sql生成查询路径树,选择最优查询路径。
调用存储引擎接口,真正执行sql语句。
把查询优化器选择的最优查询路径,即到底应该按照一个什么样的顺序和步骤去执行这个sql语句的计划,把该计划交给底层的存储引擎去真正执行。
假设我们的数据有的存在内存,有的存在磁盘文件,那到底怎么知道
- 哪些数据在内存?
- 哪些在磁盘?
执行时:
- 是更新内存数据?
- 还是更新磁盘数据?
若更新磁盘数据:
- 先查询哪个磁盘文件
- 再更新哪个磁盘文件?
这就需要存储引擎,就是个执行sql语句的,会按步骤查询内存缓存数据,更新磁盘数 据,查询磁盘数据等,执行此类的一系列的操作:
mysql架构设计中,sql接口、sql解析器、查询优化器都是通用的,属于一套组件。但支持各种存储引擎,如innodb、myisam、memory等,可以选择具体使用哪种存储引擎来负责执行sql。
执行器
根据执行计划调用存储引擎的接口。
存储引擎可帮助我们去访问内存及磁盘上的数据,那谁来调存储引擎的接口?
那就是执行器,会根据优化器选择的执行方案,按照一定的顺序和步骤调用存储引擎的接口,执行sql逻辑。
比如执行器可能先调用存储引擎的一个接口,获取“users”表中的第一行数据,然后判断一下这个数据的“id”字段的值是否等于我们期望的一个值,如果不是的话,那就继续调用存储引擎的接口,去获取“users”表的下一行数据。
也就这套操作,执行器会根据优化器生成的执行计划,不停调用存储引擎的接口们,去完成sql语句的执行计划,即不停的更新或提取一些数据:
到此这篇关于mysql通透详解架构设计的文章就介绍到这了,更多相关mysql 架构设计内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!