Mysql脏页flush及收缩表空间原理解析

程序员文章站 2022-04-01 15:48:33

mysql脏页由于wal机制，innodb在更新语句的时候，制作了写日志这一个磁盘操作，就是redo log，在内存写完redo log后，就返回给客户端，即更新成功。把内存里的数据写入磁盘的过程，...

mysql脏页

由于wal机制，innodb在更新语句的时候，制作了写日志这一个磁盘操作，就是redo log，在内存写完redo log后，就返回给客户端，即更新成功。

把内存里的数据写入磁盘的过程，术语就是flush，在flush之前，实际数据和数据库中的数据是不一致的，因为在redo log基础上更新了还未写入，数据库是老的，当内存数据页跟磁盘数据页内容不一致的时候，称这个内存页为脏页，内存写入后就一致了，称为干净页，

如果mysql偶尔运行速度很慢，很可能是在刷脏页。引发数据库flush的过程

所以我们有时使用数据库会发现数据库性能突然下降，可能就是在处理脏页。

刷脏页控制策略

innodb_io_capacity参数，这个参数会告诉innodb你的磁盘io能力。（有公式计算）
innodb刷盘主要两个因素：脏页比例和redo log的写盘速度
innodb_max_derty_pages_pct是脏页比例上限，默认是75%，调整好innodb_io_capacity参数值，使脏页比例不要超过75%收缩表空间

场景例子：数据库占用空间太大，把最大的表删掉了一半数据，表的大小还是没有变化。

数据删除流程

Mysql脏页flush及收缩表空间原理解析

加入要删掉r4，innodb引擎只会把r4这个记录标记为删除，如果之后再掺入一个id在300-600之间的记录时，会复用这个位置，但是磁盘文件的大小并不会缩小。

如果删掉了一个数据页上的所有记录，这个数据页就可以被复用。

注意：数据页的复用跟记录的复用是不同的。

插入数据流程

如果数据按照索引顺序插入的，索引是紧凑的，但是如果是随机插入的，就会造成索引的数据页分页。

Mysql脏页flush及收缩表空间原理解析

如果pagea已经满了，在插入一行数据会怎样？由于a满了，在插入一个id是550的数据时，就会申请一个新的页面pageb来保存数据，分裂完成后pagea的末尾就留下了空洞。

更新索引上的值也是删除一个旧的值，再插入一个新值，也会造成空洞。

收缩空间

新建一个与表a相同结构的表b，按照主键id递增的顺序，把数据一行一行的从a里读出来再插入到表b中，表b中无空洞，数据页的利用率也更高，如果我们把表b作为临时表，数据从表a导入到b中的操作完成后，用b替换a，从效果上也起到了收缩a的作用。

Mysql脏页flush及收缩表空间原理解析

在整个ddl过程中，表a不能有更新，所以这个ddl不是online的，在5.6之后的版本中，流程做了更改：

建立一个临时文件，扫描a中的所有数据页，

用数据页中a的记录生成b+树，存储在临时文件中

将所有对a的操作记录在一个日志文件中

临时文件生成后，将日志文件的操作应用到临时文件，得到一个逻辑数据上与表a相同的数据文件

用临时文件替换表a的数据文件

图示

Mysql脏页flush及收缩表空间原理解析

可以看到，与图3过程的不同之处在于，由于日志文件记录和重放操作这个功能的存在，这个方案在重建表的过程中，允许对表a做增删改操作。

使用alter table a engine=innodb命令来重建表。在mysql 5.5版本之前，这个命令的执行流程跟我们前面描述的差不多，区别只是这个临时表b不需要你自己创建，mysql会自动完成转存数据、交换表名、删除旧表的操作。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

相关标签： Mysql flush 收缩表空间