基于mysql 默认排序规则的坑
mysql默认varchar类型是对大小写不敏感(不区分),如果想要mysql区分大小写需要设置排序规则:
utf8_bin将字符串中的每一个字符用二进制数据存储,区分大小写。
utf8_genera_ci不区分大小写,ci为case insensitive的缩写,即大小写不敏感。
utf8_general_cs区分大小写,cs为case sensitive的缩写,即大小写敏感。
用utf8_genera_ci没有区分大小写,导致这个字段的内容区分大小写时出问题,比如作为区分大小写的code或者验证码时就出问题了。
utf8_general_cs这个选项一般没有,所以只能用utf8_bin区分大小写。
1)设置排序规则是可逆的,如果之前设置的排序规则不符合,更换排序规则后,可能出现乱码,当再次恢复原来的排序规则后,乱码即消失。
2)可以将varchar 类型改为 varbinary
3)如果已经使用了默认的排序规则,即utf8_genera_ci,而又想查询结果大小写区分,可以在查询时进行限定:
select binary column from table;
或者
select column2 from table where binary cloumn;
补充:mysql中的字符集和排序规则
字符集:
字符是各种文字和符号的总称,字符集就是字符的集合。常见字符集名称:ascii字符集、gb2312字符集、big5字符集、gb18030字符集、unicode字符集等。
计算机要识别各种字符集文字,就需要字符编码。所以有些字符集一个字符是2个字节,有些字符集一个字符是3个字节。
排序规则:举例
utf_bin和utf_general_ci这两者到底有什么区别。
ci是case insensitive, 即"大小写不敏感",a 和 a 会在字符判断中会被当做一样的;
bin是二进制, a 和a 会别区别对待.
utf8_general_ci不区分大小写,这个你在注册用户名和邮箱的时候就要使用。
utf8_general_cs区分大小写,如果用户名和邮箱用这个 就会照成不良后果
utf8_bin:字符串每个字符串用二进制数据编译存储。区分大小写,而且可以存二进制的内容
所以排序规则主要说明了是否大小写敏感和存储方式。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
推荐阅读
-
SQL Server 与MySQL中排序规则与字符集相关知识的一点总结
-
MySQL5.7中的sql_mode默认值带来的坑及解决方法
-
Mysql排序和分页(order by&limit)及存在的坑
-
基于mysql 默认排序规则的坑
-
Mysql系列第八讲 详解排序和分页(order by & limit)及存在的坑
-
基于mybatis-plus QueryWrapper 排序的坑
-
mySQL UNION运算符的默认规则研究
-
mysql的ndbcluster默认排序竟是乱序???
-
【转载】mysql数据数据表的排序规则修改
-
Mysql中的排序规则utf8_unicode_ci、utf8_general_ci的区别总结_MySQL