DDL创建数据库,表以及约束(极客时间学习笔记)
ddl
ddl是dbms的核心组件,是sql的重要组成部分. ddl的正确性和稳定性是整个sql发型的重要基础.
ddl的基础语法及设计工具
ddl的英文是data definition language,也就是数据定义语言.定义了数据库的结构和数据表的结构.常用的功能急救室增删改,对应的命令分别是create、drop和alter.
- 对数据库进行定义
create database nba; // 创建名为nba的数据库 drop database nba; // 删除名为nba的数据库
- 对数据表进行定义
create table table_name; // 创建表,table_name指表名
创建表的结构呢? 举个实际的例子, 我们创建一个球员表, 表名为player, 里面有两个字段, 一个是player_id, 它是int类型,另一个是player_name字段是varchar(255)类型, 两个字段都不能为空, 并且player_id是递增的.
接下来创建表的语句这么就是:
create table player( player_id int(11) not null auto_increment, player_name varchar(255) not null );
注意的是每个字段定义的语句最后使用 , 作为结束符, 最后一个字段的定义结束之后没有逗号的 , 并且语句最后是以 ; 结尾的. 数据类型中int(11)代表整数类型, 显示长度是11位, 括号中的参数11代表的是最大有效显示长度, 与类型包含的数值大小无关. varchar(255)代表的是最大长度为255的可变字符串类型. not null表名整个字段不能为空值,是一种数据约束. auto_increment代表主键自动增长.(一般情况下使用可视化工具类创建和操作数据库和数据库表,比如navicat)
接下来针对player表,设计下面字段:
其中player_id是数据表player的主键, 且自动增长, 也就是player_id会从1开始, 然后每次加一, 不必为它赋值. player_id、team_id、player_name这三个字段均不为空, height字段可以为空.
使用navicat工具创建表并导出的sql文件如下所示:
drop table if exists `player`; create table `player`( `player_id` int(11) not null auto_increment, `team_id` int(11) not null, `team_name` varchar(255) character set utf8 collate utf8_general_ci not null , `height` float(3,2) null default0.00, primary key(`player_id`) using btree, unique index `player_name`(`player_name`) using btree ) engine = innodb character set = utf8 collate = utf8_general_ci row_format = dynamic;
可以看到整个sql文件中的ddl处理, 首先删除player表(如果数据库中存在该表的话), 然后再创建player表, 里面的字段名和表名都使用了反引号,这是为了避免名称与mysql保留字段相同,对数据库表和字段名都加上反引号.
其中player_name字段的字符集是utf8, 排序规则是utf8_general_ci, 代表对大小写不敏感, 如果设置为utf8_bin, 表示对大小写敏感.
因为player_id设置为了主键, 所以在ddl中使用primary key进行规定,同时索引方法采用btree.
对player_name字段进行索引, 在设置索引时, 可以设置unique index(唯一索引), 也可以设置为其它索引方式, 比如normal index(普通索引), 这里我们采用unique index. 唯一索引和普通索引的区别在于对字段进行了唯一性约束. 在索引方式上, 可以选择btree和hash, 这里采用btree方法进行索引.
整个数据表的存储规则采用innodb, 是mysql5.5之后的默认存储引擎, 将字符集设置为utf8, 排序规则设置为utf8_general_ci, 行格式为dynamic, 就可以定义数据表的最后约定了:
engine = innodb character set = utf8 collate = utf8_general_ci row_format = dynamic;
修改表结构
创建完表之后, 可以对表结构进行修改, 使用ddl命令来完成.
- 添加字段
alter table player add (age int(11));
- 修改字段名, 将age字段改成player_age
alter table player rename column age to player_age;
- 修改字段的数据类型
alter table player modift (player_age float(3,1));
- 删除字段, 删除刚才添加的player_age字段
alter table player drop cloumn player_age;
数据表的常见约束
在创建数据表的时候, 会对字段进行约束, 约束的目的在于保证rdbms里面的数据的准确性和一致性.
- 主键约束
主键起的作用是唯一标识一条记录, 不能重复, 不能为空, 即unique + not null. 一个数据表的主键只能有一个. 但是主键可以是一个字段, 也可以是多个字段符合组成. 上面的player_id就是主键.
- 外键约束
外键起的作用是确保表与表之间引用的完整性. 一个表中的外键对应了另外一张表中的主键. 外键可以重复并且可以为空. 比如player_id是player表的主键,如果想设置一个球员比分表player_score, 可以再player_score中设置player_id为外键,关联到player表.
- 唯一约束
唯一约束就是表明字段在表中的数值唯一, 主要是对除主键以外的其他字段(主键自带数值唯一buff). 上面对player_name进行了唯一性约束,也就是说球员的姓名不能相同. 注意的是唯一性约束和普通索引(normal index)之间的区别: 唯一性约束相当于创建了一个约束和普通索引, 目的是保证字段的正确性, 而普通索引只是提升数据检索的速度, 并不对字段的唯一性进行约束.
- not null约束
对字段定义了not null, 表明字段不能为空, 必须有取值.
- default
表明字段的默认值, 如果在插入数据的时候该字段没有取值, 就设置为默认值.
- check约束
用来检查特定字段取值范围的有效性, check约束的结果不能为false.
设计数据表的原则
"三少一多的原则":
- 数据表的个数越少越好
rdbms的核心在于对实体和联系的定义, 也就是e-r图(entity relation diagram), 数据表越少, 说明实体和联系设计得越简洁, 即方便理解有方便操作.
- 数据表中的字段个数越少越好
字段个数越多, 数据冗余的可能性越大. 设置字段个数少的前提是各个字段相互独立, 而不是某个字段的取值可以由其它字段计算出来. 当然字段个数少是相对的, 通常会在数据冗余和检索效率中进行平衡.
- 数据表中联合主键的字段个数越少越好
设置主键是为了确定唯一性, 当一个字段无法确定唯一性, 就需要采用联合主键的方式. 联合主键中的字段越多, 占用的所以索引空间越大, 会加大理解难度, 会增加运行时间和索引空间.
- 使用主键和外键越多越好
数据库的设计实际上就是定义各种表, 一级各种字段间的关系, 关系越多, 证明实体之间的冗余度越低, 利用度越高, 这样做的好处在于不仅保证数据表之间的独立性, 还能提升相互之间的关联使用率. (不过在我现在的公司, 基本上没有使用外键, 不知道是因为影响效率还是什么, 外键的意义起不到作用)
作者的意思是大型项目中后期,可以采用业务层来实现,取消外键提高效率。不过在sql学习之初,包括在系统最初设计的时候,还是建议你采用规范的数据库设计,也就是采用外键来对数据表进行约束。因为这样可以建立一个强一致性,可靠性高的数据库结构,也不需要在业务层来实现过多的检查。当然在项目后期,业务量增大的情况下,你需要更多考虑到数据库性能问题,可以取消外键的约束,转移到业务层来实现。而且在大型互联网项目中,考虑到分库分表的情况,也会降低外键的使用。
建议是 不过在sql学习,以及项目早期,还是建议你使用外键。在项目后期,你可以分析有哪些外键造成了过多的性能消耗。一般遵循2/8原则,会有20%的外键造成80%的资源效率,你可以只把这20%的外键进行开放,采用业务层逻辑来进行实现,当然你需要保证业务层的实现没有错误。不同阶段,考虑的问题不同。当用户和业务量增大的时候,对于大型互联网应用,也会通过减少外键的使用,来减低死锁发生的概率,提高并发处理能力。
下一篇: 哈哈哈哈哈哈谢谢分享