超详细MySQL使用规范分享

程序员文章站 2022-04-19 22:04:52

最近涉及数据库相关操作较多，公司现有规范也不是太全面，就根据网上各路大神的相关规范，整理了一些自用的规范用法，万望指正。数据库环境dev: 开发环境开发可读写，可修改表结构。开发人员可以修改表结构，可...

最近涉及数据库相关操作较多，公司现有规范也不是太全面，就根据网上各路大神的相关规范，整理了一些自用的规范用法，万望指正。

数据库环境

dev: 开发环境

开发可读写，可修改表结构。开发人员可以修改表结构，可以随意修改其中的数据但是需要保证不影响其他开发同事。

test: 测试环境

开发可读写，开发人员可以通过工具修改表结构。

online: 线上环境

开发人员不允许直接在线上环境进行数据库操作，如果需要操作必须找dba进行操作并进行相应记录，禁止进行压力测试。

重点的问题，各个环境的mysql服务器对应的用户权限，一定要做到权限划分明确，有辨识度，能具体区分业务场景等。

命名规范

基本命名规则

使用有意义的英文词汇，词汇中间以下划线分隔。（不要用拼音）
只能使用英文字母，数字，下划线，并以英文字母开头。
库、表、字段全部采用小写，不要使用驼峰式命名。
避免用oracle、mysql的保留字，如desc，关键字如index。
命名禁止超过32个字符，须见名之意，建议使用名词不是动词
数据库，数据表一律使用前缀
临时库、表名必须以tmp为前缀，并以日期为后缀
备份库、表必须以bak为前缀，并以日期为后缀

为什么库、表、字段全部采用小写？

在 mysql 中，数据库和表对就于那些目录下的目录和文件。因而，操作系统的敏感性决定数据库和表命名的大小写敏感。

windows下是不区分大小写的。
linux下大小写规则
数据库名与表名是严格区分大小写的；
表的别名是严格区分大小写的；
列名与列的别名在所有的情况下均是忽略大小写的；
变量名也是严格区分大小写的；
如果已经设置了驼峰式的命名如何解决？需要在mysql的配置文件my.ini中增加 lower_case_table_names = 1即可。

表命名

同一个模块的表尽可能使用相同的前缀，表名称尽可能表达含义。所有日志表均以 log_ 开头

字段命名

表达其实际含义的英文单词或简写。布尔意义的字段以is_作为前缀，后接动词过去分词。
各表之间相同意义的字段应同名。各表之间相同意义的字段，以去掉模块前缀的表名_字段名命名。
外键字段用表名_字段名表示其关联关系。
表的主键一般都约定成为id，自增类型，是别的表的外键均使用xxx_id的方式来表明。

索引命名

非唯一索引必须按照“idx_字段名称_字段名称[_字段名]”进行命名
唯一索引必须按照“uniq_字段名称_字段名称[_字段名]”进行命名

约束命名

主键约束：pk_表名称。
唯一约束：uk_表名称_字段名。（应用中需要同时有唯一性检查逻辑。）

表设计规范

表引擎取决于实际应用场景；日志及报表类表建议用myisam，与交易，审核，金额相关的表建议用innodb引擎。如无说明，建表时一律采用innodb引擎

默认使用utf8mb4字符集，数据库排序规则使用utf8mb4_general_ci，（由于数据库定义使用了默认，数据表可以不再定义，但为保险起见，建议都写上

为什么字符集不选择utf8，排序规则不使用utf8_general_ci

采用utf8编码的mysql无法保存占位是4个字节的emoji表情。为了使后端的项目，全面支持客户端输入的emoji表情，升级编码为utf8mb4是最佳解决方案。对于jdbc连接串设置了characterencoding为utf8或者做了上述配置仍旧无法正常插入emoji数据的情况，需要在代码中指定连接的字符集为utf8mb4。

所有表、字段均应用 comment 列属性来描述此表、字段所代表的真正含义，如枚举值则建议将该字段中使用的内容都定义出来。

如无说明，表中的第一个id字段一定是主键且为自动增长，禁止在非事务内作为上下文作为条件进行数据传递。禁止使用varchar类型作为主键语句设计。

如无说明，表必须包含create_time和modify_time字段，即表必须包含记录创建时间和修改时间的字段

如无说明，表必须包含is_del，用来标示数据是否被删除，原则上数据库数据不允许物理删除。

用尽量少的存储空间来存数一个字段的数据
能用int的就不用char或者varchar
能用tinyint的就不用int
使用unsigned存储非负数值。
不建议使用enum、set类型，使用tinyint来代替
使用短数据类型，比如取值范围为0-80时，使用tinyint unsigned
存储精确浮点数必须使用decimal替代float和double
时间字段，除特殊情况一律采用int来记录unix_timestamp
存储年使用year类型。
存储日期使用date类型。
存储时间（精确到秒）建议使用timestamp类型，因为timestamp使用4字节，datetime使用8个字节。
建议使用int unsigned存储ipv4。
尽可能不使用text、blob类型
禁止在数据库中使用varbinary、blob存储图片、文件等。建议使用其他方式存储（tfs/sfs），mysql只保存指针信息。
单条记录大小禁止超过8k（列长度(中文)_3(utf8)+列长度(英文)_1）

datetime与timestamp有什么不同？

相同点：

timestamp列的显示格式与datetime列相同。显示宽度固定在19字符，并且格式为yyyy-mm-dd hh:mm:ss。

不同点：

timestamp

4个字节储存，时间范围：1970-01-01 08:00:01 ~ 2038-01-19 11:14:07值以utc格式保存，涉及时区转化，存储时对当前的时区进行转换，检索时再转换回当前的时区。
datetime8个字节储存，时间范围：1000-01-01 00:00:00 ~ 9999-12-31 23:59:59
实际格式储存，与时区无关

如何使用timestamp的自动赋值属性？

将当前时间作为ts的默认值：ts timestamp default current_timestamp。当行更新时，更新ts的值：ts timestamp default 0 on update current_timestamp。

可以将1和2结合起来：ts timestamp default current_timestamp on update current_timestamp。

如何使用int unsigned存储ip？

使用int unsigned而不是char(15)来存储ipv4地址，通过mysql函数inet_ntoa和inet_aton来进行转化。ipv6地址目前没有转化函数，需要使用decimal或者两个bigint来存储。

如无备注，所有字段都设置not null，并设置默认值；
禁止在数据库中存储明文密码
如无备注，所有的布尔值字段，如is_hot、is_deleted，都必须设置一个默认值，并设为0；
如无备注，排序字段order_id在程序中默认使用降序排列；
整形定义中不添加长度，比如使用int，而不是int[4]

int[m]，m值代表什么含义？

注意数值类型括号后面的数字只是表示宽度而跟存储范围没有关系。很多人他们认为int(4)和int(10)其取值范围分别是 (-9999到9999)和(-9999999999到9999999999)，这种理解是错误的。其实对整型中的 m值与 zerofill 属性结合使用时可以实现列值等宽。不管int[m]中m值是多少，其取值范围还是 (-2147483648到2147483647 有符号时)，(0到4294967295无符号时)。

显示宽度并不限制可以在列内保存的值的范围，也不限制超过列的指定宽度的值的显示。当结合可选扩展属性zerofill使用时默认补充的空格用零代替。例如：对于声明为int(5) zerofill的列，值4检索为00004。请注意如果在整数列保存超过显示宽度的一个值，当mysql为复杂联接生成临时表时会遇到问题，因为在这些情况下mysql相信数据适合原列宽度，如果为一个数值列指定zerofill, mysql自动为该列添加unsigned属性。

使用varbinary存储大小写敏感的变长字符串

什么时候用char，什么时候用varchar？

char和varchar类型类似，但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。char和varchar类型声明的长度表示你想要保存的最大字符数。例如，char(30)可以占用30个字符。

char列的长度固定为创建表时声明的长度。长度可以为从0到255的任何值。当保存char值时，在它们的右边填充空格以达到指定的长度。当检索到char值时，尾部的空格被删除掉。在存储或检索过程中不进行大小写转换。

varchar列中的值为可变长字符串。长度可以指定为0到65,535之间的值。(varchar的最大有效长度由最大行大小和使用的字符集确定。整体最大长度是65,532字节）。同char对比，varchar值保存时只保存需要的字符数，另加一个字节来记录长度(如果列声明的长度超过255，则使用两个字节)。varchar值保存时不进行填充。当值保存和检索时尾部的空格仍保留，符合标准sql。

char适合存储用户密码的md5哈希值，它的长度总是一样的。对于经常改变的值，char也好于varchar,因为固定长度的行不容易产生碎片，对于很短的列，char的效率也高于varchar。char(1)字符串对于单字节字符集只会占用一个字节，但是varchar(1)则会占用2个字节，因为1个字节用来存储长度信息。

索引设计规范

mysql的查询速度依赖良好的索引设计，因此索引对于高性能至关重要。合理的索引会加快查询速度（包括update和delete的速度，mysql会将包含该行的page加载到内存中，然后进行update或者delete操作），不合理的索引会降低速度。mysql索引查找类似于新华字典的拼音和部首查找，当拼音和部首索引不存在时，只能通过一页一页的翻页来查找。当mysql查询不能使用索引时，mysql会进行全表扫描，会消耗大量的io。索引的用途：去重、加速定位、避免排序、覆盖索引。

什么是覆盖索引

innodb存储引擎中，secondary index（非主键索引）中没有直接存储行地址，存储主键值。如果用户需要查询secondary index中所不包含的数据列时，需要先通过secondary index查找到主键值，然后再通过主键查询到其他数据列，因此需要查询两次。覆盖索引的概念就是查询可以通过在一个索引中完成，覆盖索引效率会比较高，主键查询是天然的覆盖索引。合理的创建索引以及合理的使用查询语句，当使用到覆盖索引时可以获得性能提升。比如select email,uid from user_email where uid=xx，如果uid不是主键，适当时候可以将索引添加为index(uid,email)，以获得性能提升。

索引的基本规范

索引数量控制，单张表中索引数量不超过5个，单个索引中的字段数不超过5个。
综合评估数据密度和分布
考虑查询和更新比例

为什么一张表中不能存在过多的索引？

innodb的secondary index使用b+tree来存储，因此在update、delete、insert的时候需要对b+tree进行调整，过多的索引会减慢更新的速度。

对字符串使用前缀索引，前缀索引长度不超过8个字符，建议优先考虑前缀索引，必要时可添加伪列并建立索引。

不要索引blob/text等字段,不要索引大型字段,这样做会让索引占用太多的存储空间

什么是前缀索引？

前缀索引说白了就是对文本的前几个字符（具体是几个字符在建立索引时指定）建立索引，这样建立起来的索引更小，所以查询更快。前缀索引能有效减小索引文件的大小，提高索引的速度。但是前缀索引也有它的坏处：mysql 不能在 order by 或 group by 中使用前缀索引，也不能把它们用作覆盖索引(covering index)。

建立前缀索引的语法：alter table table_name add key(column_name(prefix_length));

主键准则

表必须有主键
不使用更新频繁的列
尽量不选择字符串列
不使用uuid md5 hash
默认使用非空的唯一键
建议选择自增或发号器

重要的sql必须被索引，核心sql优先考虑覆盖索索引

update、delete语句的where条件列
order by、group by、distinct的字段
多表join的字段

区分度最大的字段放在前面

选择筛选性更优的字段放在最前面，比如单号、userid等，type，status等筛选性一般不建议放在最前面
索引根据左前缀原则，当建立一个联合索引(a,b,c)，则查询条件里面只有包含(a)或(a,b)或(a,b,c)的时候才能走索引,(a,c)作为条件的时候只能使用到a列索引,所以这个时候要确定a的返回列一定不能太多，不然语句设计就不合理,(b,c)则不能走索引
合理创建联合索引（避免冗余），(a,b,c) 相当于 (a) 、(a,b) 、(a,b,c)

索引禁忌

不在低基数列上建立索引，例如“性别”
不在索引列进行数学运算和函数运算
不要索引常用的小型表
尽量不使用外键
外键用来保护参照完整性，可在业务端实现
对父表和子表的操作会相互影响，降低可用性
innodb本身对online ddl的限制

mysql 中索引的限制

myisam 存储引擎索引长度的总和不能超过 1000 字节
blob 和 text 类型的列只能创建前缀索引
mysql 目前不支持函数索引
使用不等于 (!= 或者 <>) 的时候, mysql 无法使用索引。
过滤字段使用函数运算 (如 abs (column)) 后, mysql无法使用索引。
join语句中join条件字段类型不一致的时候mysql无法使用索引
使用 like 操作的时候如果条件以通配符开始 (如 ‘%abc…')时, mysql无法使用索引。
使用非等值查询的时候, mysql 无法使用 hash 索引。

语句设计规范

使用预编译语句

只传参数，比传递sql语句更高效
一次解析，多次使用
降低sql注入概率

避免隐式转换

会导致索引失效

充分利用前缀索引

必须是最左前缀
不可能同时用到两个范围条件
不使用%前导的查询，如like “%ab”

不使用负向查询，如not in/like

无法使用索引，导致全表扫描
全表扫描导致buffer pool利用率降低

避免使用存储过程、触发器、udf、events等

让数据库做最擅长的事
降低业务耦合度，为sacle out、sharding留有余地
避开bug

避免使用大表的join

mysql最擅长的是单表的主键/二级索引查询
join消耗较多内存，产生临时表

避免在数据库中进行数学运算

mysql不擅长数学运算和逻辑判断
无法使用索引

减少与数据库的交互次数

insert … on duplicate key update
replace into、insert ignore 、insert into values(),(),()
update … where id in(10,20,50,…)

合理的使用分页

限制分页展示的页数只能点击上一页、下一页采用延迟关联

如何正确的使用分页？

假如有类似下面分页语句：select * from table order by id limit 10000, 10由于mysql里对limit offset的处理方式是取出offset+limit的所有数据，然后去掉offset，返回底部的limit。所以，在offset数值较大时，mysql的查询性能会非常低。可以使用id > n 的方式进行解决：

使用id > n 的方式有局限性，对于id不连续的问题，可以通过翻页的时候同时传入最后一个id方式来解决。

http://example.com/page.php?last=100 
select * from table where id<100 order by id desc limit 10 
//上一页 
 http://example.com/page.php?first=110 
select * from table where id>110 order by id desc limit 10

这种方式比较大的缺点是，如果在浏览中有插入/删除操作，翻页不会更新，而总页数可能仍然是根据新的count(*) 来计算，最终可能会产生某些记录访问不到。为了修补这个问题，可以继续引入当前页码以及在上次翻页以后是否有插入/删除等影响总记录数的操作并进行缓存

select * from table where id >= (select id from table order by id limit #offset#, 1)

拒绝大sql，拆分成小sql
充分利用query cache
充分利用多核cpu
使用in代替or，in的值不超过1000个
禁止使用order by rand()
使用explain诊断，避免生成临时表

explain语句（在mysql客户端中执行）可以获得mysql如何执行select语句的信息。通过对select语句执行explain，可以知晓mysql执行该select语句时是否使用了索引、全表扫描、临时表、排序等信息。尽量避免mysql进行全表扫描、使用临时表、排序等。详见官方文档。

用union all而不是union

union all与 union有什么区别？

union和union all关键字都是将两个结果集合并为一个，但这两者从使用和效率上来说都有所不同。

union在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。如：

select * from test_union1 
union select * from test_union2

这个sql在运行时先取出两个表的结果，再用排序空间进行排序删除重复的记录，最后返回结果集，如果表数据量大的话可能会导致用磁盘进行排序。

而union all只是简单的将两个结果合并后就返回。这样，如果返回的两个结果集中有重复的数据，那么返回的结果集就会包含重复的数据了。

从效率上说，union all要比union快很多，所以，如果可以确认合并的两个结果集中不包含重复的数据的话，那么就使用union all，如下：

select * from test_union1 union all select * from test_union2

程序应有捕获sql异常的处理机制
禁止单条sql语句同时更新多个表
不使用select * ，select语句只获取需要的字段
消耗cpu和io、消耗网络带宽
无法使用覆盖索引
减少表结构变更带来的影响
因为大，select/join 可能生成临时表
update、delete语句不使用limit
insert语句必须显式的指明字段名称，不使用insert into table()
insert语句使用batch提交（insert into table values(),(),()……），values的个数不超过500
统计表中记录数时使用count(*)，而不是count(primary_key)和count(1) 备注：仅针对myisam
数据更新建议使用二级索引先查询出主键，再根据主键进行数据更新
禁止使用跨库查询
禁止使用子查询，建议将子查询转换成关联查询
针对varchar类型字段的程序处理，请验证用户输入，不要超出其预设的长度；

分表规范

单表一到两年内数据量超过500w或数据容量超过10g考虑分表，需提前考虑历史数据迁移或应用自行删除历史数据，采用等量均衡分表或根据业务规则分表均可。要分表的数据表必须与dba商量分表策略

用hash进行散表，表名后缀使用十进制数，下标从0开始
按日期时间分表需符合yyyy[mm][dd][hh]格式
采用合适的分库分表策略。例如千库十表、十库百表等
禁止使用分区表，分区表对分区键有严格要，分区表在表变大后执行ddl、sharding、单表恢复等都变得更加困难。
拆分大字段和访问频率低的字段，分离冷热数据

行为规范

批量导入、导出数据必须提前通知dba协助观察
禁止在线上从库执行后台管理和统计类查询
禁止有super权限的应用程序账号存在
产品出现非数据库导致的故障时及时通知dba协助排查
推广活动或上线新功能必须提前通知dba进行流量评估
数据库数据丢失，及时联系dba进行恢复
对单表的多次alter操作必须合并为一次操作
不在mysql数据库中存放业务逻辑
重大项目的数据库方案选型和设计必须提前通知dba参与
对特别重要的库表，提前与dba沟通确定维护和备份优先级
不在业务高峰期批量更新、查询数据库其他规范
提交线上建表改表需求，必须详细注明所有相关sql语句

其他规范

日志类数据不建议存储在mysql上，优先考虑hbase或oceanbase，如需要存储请找dba评估使用压缩表存储。

以上就是超详细mysql使用规范分享的详细内容，更多关于mysql使用规范的资料请关注其它相关文章！

超详细MySQL使用规范分享

PHP MySQL应用中使用XOR运算加密算法分享

RedHat下MySQL的基本使用方法分享_MySQL

MYSQL入门学习之十七：MYSQL命令行内可使用的命令详细说明_MySQL

MYSQL入门学习之十七：MYSQL命令行内可使用的命令详细说明_MySQL

超详细的JavaScript进阶学习之DOM技术（整理分享）

如何解决PHP使用mysql_query查询超大结果集超内存问题

mysql刷新命令（mysql安装及配置超详细教程）

在MySQL中使用JOIN语句进行连接操作的详细教程

MySql like模糊查询通配符使用详细介绍

mysql刷新命令（mysql安装及配置超详细教程）