《SQL Server 2008从入门到精通》--20180628
数据库基本概念:区、页、行
区:SQL Server中管理空间的基本单位。一个区大小为64KB,是八个物理上连续的页。SQL Server中每MB有16个区。一旦一个区被存储满,SQL Server将分配一个区给下一条数据。
页:SQL Server中存储数据的基本单位,是区的分配单元。一个页大小为8KB。是SQL Server 每次读取和写入数据的最小单位。页的类型有数据页,索引页,文本页等等。
行:行存储于页中,一行一般最多占满一页,也就是8KB,但也有些VARCHAR(MAX),TEXT,IMAGE类型的字段,可以跨越多页存储,一行最大2GB。
收缩数据库
数据库中每个文件都可以通过删除未使用的页的方法来收缩。数据文件和事务日志文件都可以收缩。数据库收缩分为手动收缩和通过数据库设置自动收缩。
设置数据库自动收缩
数据库引擎会定期检查每个数据库的空间使用情况,自动收缩有可用空间的数据库。
ALTER DATABASE test SET AUTO_SHRINK ON;
设置关闭自动收缩
ALTER DATABASE test SET AUTO_SHRINK OFF;
数据库手动收缩
DBCC SHRINKDATABASE(test,10);
GO
或者使用如下命令:
USE test DBCC SHRINKFILE('test',0,TRUNCATEONLY);
上面命令收缩了test数据库的test.mdf文件,设置目标文件大小为0MB,TRUNCATEONLY参数表示将文件所有可用空间全部释放给操作系统,但不在文件内部执行页迁移。
收缩事务日志文件
若要运行SHRINKFILE命令收缩文件,首先要将数据库恢复模式设置成SIMPLE来截断该文件。
USE test GO ALTER DATABASE test SET RECOVERY SIMPLE;--将test数据库恢复模式设置成SIMPLE GO DBCC SHRINKFILE('test_log',1,TRUNCATEONLY); --将test_log.ldf文件收缩到MB,且不允许文件内部页迁移 GO ALTER DATABASE test SET RECOVERY FULL; --将test数据库恢复模式设置回FULL GO
截断数据文件
必须先用SELECT语句获取数据文件的file_id
USE test GO SELECT FILE_ID,name FROM sys.database_files;--获取test数据库中数据文件和日志文件的file_id GO DBCC SHRINKFILE(1,TRUNCATEONLY);--截断并收缩该file_id对应的文件 GO
清空文件
ALTER DATABASE test--创建一个空数据文件test1data.ndf放在E盘 ADD FILE( NAME='test1data', FILENAME='E:\test1data.ndf', SIZE=5MB ); GO DBCC SHRINKFILE('test1data',EMPTYFILE);--利用SHRINKFILE语句清空该数据文件 GO ALTER DATABASE test--删除该文件 REMOVE FILE test1data; GO
复制和移动数据库
SQL Server 2008使用2中方式来进行复制和移动数据库操作。
分离和附加数据库
此方法是复制和移动数据库的最快方式。要求用户必须是源和目标服务器sysadmin固定服务器角色的成员,源数据库脱机,分离数据库前要将数据库设置成单用户模式。
SQL管理对象
此方法稍慢,但不要求数据库脱机,要求用户是源数据库所有者且有CREATE DATABASE的权限。右键数据库—任务—复制数据库。
优化数据库
优化数据库就是提高数据库的稳定性,运行速度和执行能力。主要从3个方面对数据库进行优化。
数据文件和事务日志文件的放置
尽量把多个数据文件分散在不同物理驱动器的不同逻辑磁盘上。尽量把数据文件和事务日志文件分散在不同物理驱动器的不同逻辑磁盘上。这样做的目的是可以同时从多个物理磁盘驱动器上读取文件,让系统执行并行操作,提高系统使用数据的效率。
例如假设SQL Server 2008有A,B两个物理驱动器,A下有C,D两个逻辑磁盘,B下有E,F两个逻辑磁盘,数据库test有test1.mdf和test2.mdf两个数据文件,test1_log.ldf和test2_log.ldf两个事务日志文件。此时最佳做法是将这4个文件分别放在CDEF4个逻辑磁盘内。
使用文件组
文件组是数据库文件的集合,方便数据库数据的管理与分配。文件组中的文件不能再移动到其他文件组中,文件组中只包含数据文件,不包含事务日志文件。文件组只能提高性能,不能提高稳定性,因为一旦文件组中有1个文件早到破坏,整个文件组的数据都无法使用。
RAID技术的使用
Redundant Array of Independent Disks,即独立磁盘冗余阵列,是由多个磁盘驱动器组成的磁盘系统,比较复杂,在此不做详细描述。
表的基础知识
临时表
临时表分为本地临时表和全局临时表。本地临时表表名#打头,只对当前用户连接可见,用户断开连接后被自动删除。全局临时表表名##打头,对所有用户都可见,当所有引用该表的用户断开连接时被自动删除。
系统表
系统表存储了SQL Server 2008服务器配置,数据库设置,用户和表对象描述等信息,一般来说只能由DBA来使用该表。
注:数据库表操作已掌握,此处省略。
数据类型
整数数据类型
Bigint:存储范围-263~263-1范围内所有正负整数,存储在8个字节中,每个字节长度8位
Int:存储范围-231~231-1范围内所有正负整数,存储在4个字节中,每个字节长度8位
Smallint:存储范围-215~215-1范围内所有正负整数,存储在2个字节中,每个字节长度8位
Tinyint: 存储范围0~255范围内所有正整数,存储在1个字节中,每个字节长度8位
Bit(位类型)
只有0和1两种取值,作为逻辑变量使用,用来表示真与假,是与否的二值选择
Money和Smallmoney(货币类型)
Money:用于存储货币值,存储范围-263~263-1,分为整数部分和小数部分,前4个字节存储整数部分,后4个字节存储小数部分。精确到小数点后四位。
Smallmoney:用于存储货币值,存储范围-231~231-1,分为整数部分和小数部分,前2个字节存储整数部分,后2个字节存储小数部分。精确到小数点后四位。
近似数字数据类型
针对类似无限循环小数这种无法精确表示的数据
Real:存储范围-3.40E-38~3.40E+38范围内的正负十进制数值,精确到第7位小数。用4个字节存储空间。
Float(n):存储范围-1.79E-308~1.79E+308,精确到第15位小数,参数n可指示保存4字节或8字节。
Decimal(p,s):取值范围-1038+1~1038-1,带有固定精度和位数的数据类型,p表示精度,s表示位数。p的取值范围1~38,s的取值范围0~p,占用2~17个字节的存储空间
Numeric:SQL Server2008中同decimal(p,s)
Unicode字符数据类型
Nchar(n):固定长度的字符数据类型。参数n代表字节数,取值范围1~4000
Nvarchar(n): 可变长度的字符数据类型。参数n代表字节数,取值范围1~4000
Ntext:最大长度可到达230-1个字符。
二进制数据类型
Binary:存储固定长度的二进制数据。最大长度8000
Varbinary:存储可变长度的二进制数据。存储长度为实际输入的数据长度+4个字节
Image:存储照片,目录图片或图画,不能直接通过insert语句输入,存储长度最大为2GB
时间日期数据类型
Date:只存储日期数据类型,范围0001-01-01到9999-12-31
Time:只存储时间数据类型,范围00:00:00.0000000到23:59:59.9999999
Datetimeoffset:由年月日时分秒小数秒组成的时间结构
Datetime2:时间日期混合组成的时间结构,其中小数秒的位数可以设置
字符串数据类型
Char:固定长度字符串数据类型,每个字符使用一个字节的存储空间,最大占位8000个字符
Varchar: 可变长度字符串数据类型,其余同char
Text:可变长度字符串数据类型,最大占位231-1个字符
注:选择固定长度数据类型还是可变长度数据类型,应考虑存储的数据长度是否相同,相同则使用固定长度数据类型,不同但差别不大,考虑到节省存储空间,提高数据库运行效率,应选择可变长度数据类型。
其他数据类型
Sql_variant:用于存储各种数据类型(int,binary,char)
Timestamp:时间戳数据类型,反应数据库中数据修改的相对顺序,相当于单调上升的计时器
Uniqueidentifier:16字节长的二进制数据类型,存储全局唯一标识符代码,可通过调用SQL Server的newid()函数获得,全球唯一。
Xml:用于保存整个XML文档
Table:用于存储对表或试图处理后的结果集
Cursor:是变量或者存储过程OUTPUT参数的一种数据类型,包含对游标的引用。
创建自己的数据类型
使用存储过程sp_addtype创建自己的数据类型
USE test GO EXEC sp_addtype credit,'int','NULL';
新数据类型名称credit,参照系统数据类型int,允许为空。
定义标识字段IDENTITY的应用
当一个字段被IDENTITY定义为标识字段,当新增一条记录,该字段会被系统自动赋值,并按设置的增量递增。每个表只允许指定1个标识字段。
USE test GO ALTER TABLE CustNew ADD s_id INT IDENTITY(1,1); GO
上述语句为CustNew表新增一个s_id列,该列数据类型为int,标量种子为1,增量为1。再例如
USE test GO ALTER TABLE CustCopy ADD t_id INT IDENTITY(2,4); GO
然后查询该表数据如下
我们再来看一个错误的案例
USE test GO ALTER TABLE a ADD t_id VARCHAR(12) IDENTITY(2,4); GO
新增一个列t_id并将数据类型设置为VARCHAR,将该字段设置为标识字段,下面是报错
消息2749,级别16,状态2,第1 行
标识列't_id' 的数据类型必须是int、bigint、smallint、tinyint 或decimal,或者是小数位数为0 的numeric 数据类型,并且约束为不可为Null。
注:取消标识列最常用的办法就是新建一列并删除标识列,再将新建列的列名修改成标识列的列名。就是替代的方法。
数据库的完整性
数据的值必须正确无误,数据类型必须正确设置,且必须确保统一表格数据之间和不同表格数据之间的相容关系。
实体完整性
通过设定主键,唯一键,标识列,唯一索引等多种方法,确保数据库中所有实体的唯一性。
区域完整性
通过设定默认值,检查,外键,数据类型和规则等多种方法,确保字段值在一个特定的允许范围内。
参考完整性
通过设定外键,检查,触发器和存储过程等多种方法,确保相关数据库表之间数据一致性。
用户自定义类型
通过设定规则,触发器,存储过程和约束自定义数据,来确保自定义完整性。
推荐阅读
-
《SQL Server 2008从入门到精通》--20180703
-
《Microsoft SQL Server 2005: 数据库基础由入门到精通》书评
-
《SQL Server 2008从入门到精通》--20180629
-
MyBatis从入门到精通(八):MyBatis动态Sql之foreach标签的用法
-
《SQL Server 2008从入门到精通》--20180724
-
《SQL Server 2008从入门到精通》20180627
-
《SQL Server 2008从入门到精通》--20180716
-
《SQL Server 2008从入门到精通》--20180717
-
《SQL Server 2008从入门到精通》--20180710
-
MyBatis从入门到精通(七):MyBatis动态Sql之choose,where,set标签的用法