达梦初始化参数CHARSET与LENGTH_IN_CHAR
程序员文章站
2022-06-03 11:51:14
...
在使用dminit工具或dbca图形化工具初始化达梦数据库实例时,有两个参数:
1. CHARSET/UNICODE_FLAG:字符集(可选0.GB18030,1.UTF-8,2.EUC-KR,默认为0,即GB18030);
2. LENGTH_IN_CHAR:varchar类型长度是否以字符为单位(可选Y/N,默认为N,即不以字符为单位);
在达梦数据库中,这两个初始化参数在实例创建完成后,不能修改,若发现选错了,只能重新初始化一个新的实例。
字符集比较好理解,就是字符的不同表示方式,具体区别可以看这个链接:
https://segmentfault.com/q/1010000004240543
在数据库中主要就是长度的问题,比如汉字用utf-8表示一般占三个字节,而用gb18030表示占两个字节。
另一个参数,length_in_char,表示varchar类型是否以字符为单位。需要注意的是,这个参数只影响varchar类型,而不影响char类型。
具体来说就是当该参数为1或者Y时,在数据库中创建varchar类型的字段时,会自动扩充精度,具体扩充多少倍有以下几种情况:
1. charset=1,length_in_char=1时:
自动扩充四倍,测试如下:
create table test1(a int,b varchar(12));
insert into test1 values (1,'哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈'); --插入成功
insert into test1 values (1,'哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈a'); --插入失败,列B长度超出定义
注意看上图,B列的精度为48;
2.charset=0,length_in_char=1时:
B列的精度为24,扩充两倍,此时可以存12个汉字,24个英文字母;
还有需要注意的是,不管选择的是什么字符集,varchar类型是否以字符为单位,varchar类型的最大精度为8188(实际最大精度还取决于页大小,参加达梦的dba手册)