MySQL 数据类型和建库策略
程序员文章站
2023-11-16 20:59:10
一、数字类型。数字类型按照我的分类方法分为三类:整数类、小数类和数字类。 我所谓的“数字类”,就是指decimal和numeric,它们是同一种类型。它严格的说不是一种数字...
一、数字类型。数字类型按照我的分类方法分为三类:整数类、小数类和数字类。
我所谓的“数字类”,就是指decimal和numeric,它们是同一种类型。它严格的说不是一种数字类型,因为他们实际上是将数字以字符串形式保存的;他的值的每一位(包括小数点)占一个字节的存储空间,因此这种类型耗费空间比较大。但是它的一个突出的优点是小数的位数固定,在运算中不会“失真”,所以比较适合用于“价格”、“金额”这样对精度要求不高但准确度要求非常高的字段.
小数类,即浮点数类型,根据精度的不同,有float(单精度)和double(双精度)两种。它们的优势是精确度,float可以表示绝对值非常小、小到约 1.17e-38 (0.000…0117, 小数点后面有37个零)的小数,而double更是可以表示绝对值小到约 2.22e-308 (0.000…0222, 小数点后面有307个零)的小数。float类型和double类型占用存储空间分别是4字节和8字节。如果需要用到小数的字段,精度要求不高的,当然用float了!可是说句实在话,我们“民用”的数据,哪有要求精度那么高的呢?这两种类型至今我没有用过——我还没有遇到适合于使用它们的事例。
用的最多的,最值得精打细算的,是整数类型。从只占一个字节存储空间的tinyint到占8个字节的bigint,挑选一个“够用”并且占用存储空间最小的类型是设计数据库时应该考虑的。tinyint、smallint、mediumint、int和bigint占用存储空间分别为1字节、2字节、3字节、4字节和8字节,就无符号的整数而言,这些类型能表示的最大整数分别为255、65535、16777215、4294967295和18446744073709551615。如果用来保存用户的年龄(举例来说,数据库中保存年龄是不可取的),用tinyint就够了;九城的《纵横》里,各项技能值,用smallint也够了;如果要用作一个肯定不会超过16000000行的表的auto_increment的identify字段,当然用 mediumint 不用 int ,试想,每行节约一个字节,16000000行可以节约10兆多呢!
二、日期时间类型。
日期和时间类型比较简单,无非是 date、time、datetime、timestamp和year等几个类型。只对日期敏感,而对时间没有要求的字段,就用date而不用datetime是不用说的了;单独使用时间的情况也时有发生——使用time;但最多用到的还是用datetime。在日期时间类型上没有什么文章可做,这里就不再详述。
三、字符(串)类型。
不要以为字符类型就是 char !char和varchar的区别在于char是固定长度,只要你定义一个字段是char(10),那么不论你存储的数据是否达到了10个字节,它都要占去10个字节的空间;而varvhar则是可变长度的,如果一个字段可能的值是不固定长度的,我们只知道它不可能超过10个字符,把它定义为 varchar(10)是最合算的,varchar 类型的实际长度是它的值的(实际长度+1)。为什么“+1”呢?这一个字节用于保存实际使用了多大的长度呀!从这个“+1”中也应该看到,如果一个字段,它的可能值最长是10个字符,而多数情况下也就是用到了10个字符时,用varchar就不合算了:因为在多数情况下,实际占用空间是11个字节,比用char(10)还多占用一个字节!
举个例子,就是一个存储股票名称和代码的表,股票名称绝大部分是四个字的,即8个字节;股票代码,上海的是六位数字,深圳的是四位数字。这些都是固定长度的,股票名称当然要用 char(8) ;股票代码虽然是不固定长度,但如果使用varvhar(6),一个深圳的股票代码实际占用空间是5个字节,而一个上海的股票代码要占用7个字节!考虑到上海的股票数目比深圳的多,那么用varchar(6)就不如char(6)合算了。
虽然一个char或varvhar的最大长度可以到255,我认为大于20的char是几乎用不到的——很少有大于20个字节长度的固定长度的东东吧?不是固定长度的就用varchar!大于100的varchar也是几乎用不到的——比这更大的用text就好了。tinytext,最大长度为255,占用空间也是(实际长度+1);text,最大长度65535,占用空间是(实际长度+2);mediumtext,最大长度16777215,占用空间是(实际长度+3);longtext,最大长度4294967295,占用空间是(实际长度+4)。为什么“+1”?“+2”?“+3”?“+4”?你要是还不知道就该打pp了。这些可以用在论坛啊、新闻啊,什么的,用来保存文章的正文。根据实际情况的不同,选择从小到大的不同类型。
四、枚举和集合类型。
枚举(enum)类型,最多可以定义65535种不同的字符串从中做出选择,只能并且必须选择其中一种,占用存储空间是一个或两个字节,由枚举值的数目决定;集合(set)类型,最多可以有64个成员,可以选择其中的零个到不限定的多个,占用存储空间是一个到八个字节,由集合可能的成员数目决定。
举个例子来说,在sqlserver中,你可以节约到用一个bit类型来表示性别(男/女),但mysql没有bit,用tintint?不,可以用enum(帅哥,美眉)!只有两种选择,所以只需一个字节——跟tinyint一样大,但却可以直接用字符串帅哥和美眉来存取。真是太方便啦!
我所谓的“数字类”,就是指decimal和numeric,它们是同一种类型。它严格的说不是一种数字类型,因为他们实际上是将数字以字符串形式保存的;他的值的每一位(包括小数点)占一个字节的存储空间,因此这种类型耗费空间比较大。但是它的一个突出的优点是小数的位数固定,在运算中不会“失真”,所以比较适合用于“价格”、“金额”这样对精度要求不高但准确度要求非常高的字段.
小数类,即浮点数类型,根据精度的不同,有float(单精度)和double(双精度)两种。它们的优势是精确度,float可以表示绝对值非常小、小到约 1.17e-38 (0.000…0117, 小数点后面有37个零)的小数,而double更是可以表示绝对值小到约 2.22e-308 (0.000…0222, 小数点后面有307个零)的小数。float类型和double类型占用存储空间分别是4字节和8字节。如果需要用到小数的字段,精度要求不高的,当然用float了!可是说句实在话,我们“民用”的数据,哪有要求精度那么高的呢?这两种类型至今我没有用过——我还没有遇到适合于使用它们的事例。
用的最多的,最值得精打细算的,是整数类型。从只占一个字节存储空间的tinyint到占8个字节的bigint,挑选一个“够用”并且占用存储空间最小的类型是设计数据库时应该考虑的。tinyint、smallint、mediumint、int和bigint占用存储空间分别为1字节、2字节、3字节、4字节和8字节,就无符号的整数而言,这些类型能表示的最大整数分别为255、65535、16777215、4294967295和18446744073709551615。如果用来保存用户的年龄(举例来说,数据库中保存年龄是不可取的),用tinyint就够了;九城的《纵横》里,各项技能值,用smallint也够了;如果要用作一个肯定不会超过16000000行的表的auto_increment的identify字段,当然用 mediumint 不用 int ,试想,每行节约一个字节,16000000行可以节约10兆多呢!
二、日期时间类型。
日期和时间类型比较简单,无非是 date、time、datetime、timestamp和year等几个类型。只对日期敏感,而对时间没有要求的字段,就用date而不用datetime是不用说的了;单独使用时间的情况也时有发生——使用time;但最多用到的还是用datetime。在日期时间类型上没有什么文章可做,这里就不再详述。
三、字符(串)类型。
不要以为字符类型就是 char !char和varchar的区别在于char是固定长度,只要你定义一个字段是char(10),那么不论你存储的数据是否达到了10个字节,它都要占去10个字节的空间;而varvhar则是可变长度的,如果一个字段可能的值是不固定长度的,我们只知道它不可能超过10个字符,把它定义为 varchar(10)是最合算的,varchar 类型的实际长度是它的值的(实际长度+1)。为什么“+1”呢?这一个字节用于保存实际使用了多大的长度呀!从这个“+1”中也应该看到,如果一个字段,它的可能值最长是10个字符,而多数情况下也就是用到了10个字符时,用varchar就不合算了:因为在多数情况下,实际占用空间是11个字节,比用char(10)还多占用一个字节!
举个例子,就是一个存储股票名称和代码的表,股票名称绝大部分是四个字的,即8个字节;股票代码,上海的是六位数字,深圳的是四位数字。这些都是固定长度的,股票名称当然要用 char(8) ;股票代码虽然是不固定长度,但如果使用varvhar(6),一个深圳的股票代码实际占用空间是5个字节,而一个上海的股票代码要占用7个字节!考虑到上海的股票数目比深圳的多,那么用varchar(6)就不如char(6)合算了。
虽然一个char或varvhar的最大长度可以到255,我认为大于20的char是几乎用不到的——很少有大于20个字节长度的固定长度的东东吧?不是固定长度的就用varchar!大于100的varchar也是几乎用不到的——比这更大的用text就好了。tinytext,最大长度为255,占用空间也是(实际长度+1);text,最大长度65535,占用空间是(实际长度+2);mediumtext,最大长度16777215,占用空间是(实际长度+3);longtext,最大长度4294967295,占用空间是(实际长度+4)。为什么“+1”?“+2”?“+3”?“+4”?你要是还不知道就该打pp了。这些可以用在论坛啊、新闻啊,什么的,用来保存文章的正文。根据实际情况的不同,选择从小到大的不同类型。
四、枚举和集合类型。
枚举(enum)类型,最多可以定义65535种不同的字符串从中做出选择,只能并且必须选择其中一种,占用存储空间是一个或两个字节,由枚举值的数目决定;集合(set)类型,最多可以有64个成员,可以选择其中的零个到不限定的多个,占用存储空间是一个到八个字节,由集合可能的成员数目决定。
举个例子来说,在sqlserver中,你可以节约到用一个bit类型来表示性别(男/女),但mysql没有bit,用tintint?不,可以用enum(帅哥,美眉)!只有两种选择,所以只需一个字节——跟tinyint一样大,但却可以直接用字符串帅哥和美眉来存取。真是太方便啦!