MySQL修改字符集的实战教程
前言:
在 mysql 中,系统支持诸多字符集,不同字符集之间也略有区别。目前最常用的字符集应该是 utf8 和 utf8mb4 了,相比于 utf8 ,utf8mb4 支持存储 emoji 表情,使用范围更广。本篇文章将会介绍 utf8 修改成 utf8mb4 字符集的方法。
1. utf8 和 utf8mb4 字符集介绍
字符(character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(character set)是多个字符的集合。
mysql 中字符集可以作用于四个级别,分别是:服务器级别、数据库级别、表级别、列级别。服务器级别的比较规则由 character_set_server 参数控制,如果创建数据库、表、列时没有显式的指定字符集,则会继承上一级的字符集。
mysql 5.7 及之前版本默认的字符集是 latin1 ,mysql 8.0 版本默认的字符集是 utf8mb4 。不过使用 latin1 容易导致乱码,所以还是 utf8 和 utf8mb4 用途最广泛。utf8 其实是 utf8mb3 的别名,只使用 1~3 个字节表示字符。utf8mb4 使用 1~4 个字节表示字符,能够存储更多的 emoji 表情及任何新增的 unicode 字符。utf8mb4 兼容 utf8 ,且比 utf8 能表示更多的字符,是 utf8 字符集的超集。所以现在一些新的业务建议将数据库的字符集设置为 utf8mb4 ,特别是有表情存储需求时。
2. 修改字符集方法
目前的互联网业务对 emoji 表情存储的需求越来越多,比如昵称、评论内容等都要支持表情符号,这个时候如果数据库字段用的是 utf8 字符集,则会报如下错误:
java.sql.sqlexception: incorrect string value: '\xf0\x9f\x92\x95\xf0\x9f...' for column…………
为了业务需求,我们需要将数据库字符集改为 utf8mb4 ,好在 utf8mb4 是 utf8 的超集,除了将编码改为 utf8mb4 外不需要做其他转换。这里简单讲下修改方法。
系统参数修改
首先应该修改系统字符集参数,这样以后创建的库表默认字符集就是 utf8mb4 了。找到配置文件,添加或修改以下参数:
vi /etc/my.cnf [mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_general_ci skip-character-set-client-handshake #忽略应用连接自己设置的字符编码,保持与全局设置一致 [client] default-character-set=utf8mb4 [mysql] default-character-set=utf8mb4
修改数据库字符集
对于已经创建的数据库,如果原来是 utf8 字符集,则可以这么修改:
# 设置数据库字符集编码 alter database `dbname` character set utf8mb4 collate utf8mb4_general_ci; # 示例 mysql> show create database testdb; +----------+-----------------------------------------------------------------+ | database | create database | +----------+-----------------------------------------------------------------+ | testdb | create database `testdb` /*!40100 default character set utf8 */ | +----------+-----------------------------------------------------------------+ 1 row in set (0.00 sec) mysql> alter database `testdb` character set utf8mb4 collate utf8mb4_general_ci; query ok, 1 row affected (0.01 sec) mysql> show create database testdb; +----------+--------------------------------------------------------------------+ | database | create database | +----------+--------------------------------------------------------------------+ | testdb | create database `testdb` /*!40100 default character set utf8mb4 */ | +----------+--------------------------------------------------------------------+ 1 row in set (0.00 sec)
修改表及字段字符集
同样的,对于已经创建的表,修改全局及数据库的字符集并不会影响原表及字段的字符集。原有的 utf8 表可以采用如下方法修改:
# 修改表字符集 alter table `tb_name` default character set utf8mb4; # 修改某字段字符集 alter table `tb_name` modify col_name varchar(20) character set utf8mb4; # 同时修改表及字段字符集 alter table `tb_name` convert to character set utf8mb4 collate utf8mb4_general_ci; # 如果某个库里面表比较多 可以拼接出要执行的批量修改语句 select concat( 'alter table ', table_name, ' convert to character set utf8mb4 collate utf8mb4_general_ci;' ) from information_schema.`tables` where table_schema = 'testdb';
3. 一些建议
看起来修改方法挺简单,不过对于生产环境还是要格外小心。特别是修改字段字符集时,会加锁,阻止写操作,对于大表执行下来也是很慢的,可能对线上业务造成影响。
如果你的数据库比较小,用以上方法应该问题不大。对于线上环境,若要修改字符集,一定要做好评估,最好可以在业务低峰期停机修改,修改前一定要先备份。若无停机时间,可以考虑先在备库修改,然后再主备切换,不过这样做会更麻烦。
有条件的话也可以再准备一个空实例,先导入表结构,改成 utf8mb4 字符集后再导入数据。这也是一种方法,不过也可能需要停机切换。
以上就是mysql修改字符集的方法的详细内容,更多关于mysql修改字符集的资料请关注其它相关文章!
上一篇: 2018爆发的小程序,小程序代理成你创业的成功捷径
下一篇: 盐吃多了有哪些危害呢
推荐阅读
-
ElasticSearch实战系列三: ElasticSearch的JAVA API使用教程
-
Ubuntu彻底卸载MySQL、Apache2和Php的方法教程
-
Mysql数据库绿色版安装教程 解决系统错误1067的方法
-
关于mysql查询字符集不匹配问题的解决方法
-
MySQL配置文件无法修改的解决方法(Win10)
-
CAXA背景颜色怎么变成白色? CAXA修改背景色的教程
-
edius视频源文件怎么修改尺寸? edius调整视频尺寸的教程
-
Linux mysql如何更改root密码以及忘记root密码的修改方法
-
centos6.5 Linux下用安装包方式安装MySQL的步骤教程
-
mysql返回表中某行或者多行的重复值操作教程