欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

MySQL之字符集与校对集

程序员文章站 2022-06-06 15:34:51
...

由此可得出当connection和服务器的字符集比client小时,会造成数据的丢失,可能用语不是很准确,但是能理解即可以了。个人理解,就

一、字符集

1.MySQL的字符集设置非常灵活

如果某一级别没有指定字符集,则继承上一级。

查看所有字符集语句:show character set;

2.以表声明为utf-8为例,最终存储在表中的数据为utf-8

MySQL之字符集与校对集

①我们要告诉服务器,我给你发送的数据是什么编码?character_set_client

②告诉字符集转换器,转换成什么编码?character_set_connection

③查询的结果用什么编码?character_set_results

如果以上三者都为字符集N,可简写为set names N;

3.什么情况下会出现乱码呢?

我们首先创建一个测试表指定表的字符集为utf8

create table temp(

name varchar(10)

) charset utf8;

然后执行这三条命令:

set character_set_client=gbk;

set character_set_connection=gbk;

set_character_set_results=gbk; 这三句可以简写为set names gbk;

最后往表里插入一条数据:

insert into temp values('中国');

select * from temp;这时候显示的结果是正常的。

当我们再执行这句命令时:set character_results=utf8;

出现乱码了,如图:

MySQL之字符集与校对集

由此可得出当返回的结果result的字符集与客户端的字符集不符的时候会出现乱码。

还有一种情况也会出现乱码:client声明与事实不符时,你客户端明明是utf8,你却非要叫我转成gbk的,如下图:

MySQL之字符集与校对集

可能还有很多种情况,这里没有一一列举。

4.什么情况下会造成数据的丢失呢?

执行这三条语句:

set character_set_client=gbk;

set character_set_connection=latin1;

set character_set_results=gbk;

再往表里插入一条数据:insert into temp values('美国');

最后查询的时候结果如下图:

MySQL之字符集与校对集

数据丢失了。

由此可得出当connection和服务器的字符集比client小时,会造成数据的丢失,可能用语不是很准确,但是能理解即可以了。个人理解,就跟java里面不同数据类型相互转换时一样,比如把double类型强制转换成int类型,就会造成精度的丢失一样。

。。。。。。    

二、校对集

什么是校对集?

校对集:指字符集的排序规则。

查看所有校对集语句:show collation;

一种字符集可以有一个或多个排序规则。

以utf8为例,默认是使用utf8_general_ci校对集,,也可以按二进制来排,utf8_bin

怎样声明校对集?

create table tableName

(

  ...

)charset utf8 collate utf8_general_ci;

注意:声明的校对集必须是字符集合法的校对集。比如你字符集是utf8,你不能声明gbk的校对集。

三、校对规则的“可压缩性”

在绝大多数查询中,mysql使用哪种校对规则进行比较是很显然的。例如,在下列情况中,校对规则明显的是“列x的列校对规则”:

select x from T orderbyx;

select x from T wherex = x;

select distinct x fromT;

但是,当涉及多个操作数时,可能不明确。例如:

select x from T wherex ='Y';

这个查询应该使用列x的校对规则,还是字符串文字'Y'的校对规则?

标准化SQL使用“可压缩性”规则解决这种问题。基本上,这个意思是:既然x和'Y'都有 校对规 则,哪个校对规则优先?这可能比较难解决,但是以下规则适合大多数情况:

一个外在的COLLATE子句可压缩性是0(根本不能压缩。)使用不同校对规则的两个字符串连接的可压缩性是1。列校对规则的可压缩性是2。“系统常数”(如USER()或VERSION()函数返回的字符串)可压缩性是3。文字规则的可压缩性是4。NULL或从NULL派生的表达式的可压缩性是 5。

上述可压缩性值是mysql当前所用的。

这样上述规则可以模糊解决:

使用最低的可压缩性值的校对规则。如果两侧有相同的可压缩性,那么如果校对规则不同则发生错误。

使用COERCIBILITY()函数确定一个字符串表达式的可压缩性:

mysql> SELECTCOERCIBILITY('A'COLLATE latin1_swedish_ci);

-> 0

mysql> SELECTCOERCIBILITY(VERSION());

-> 3

mysql> SELECTCOERCIBILITY('A');

-> 4

本文永久更新链接地址