欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

mysql 开发基础系列14 字符集

程序员文章站 2023-09-28 08:39:10
字符集是一套文字符号及其编码,比较规则的集合。第一个字符集是ascll(american standard code for information interchange)。 1. 选择合适的字符集 对于数据库来说,字符集很重要,因为数据库存储的数据大部分是各种文字,字符集对数据库的存储,处理性能 ......

字符集是一套文字符号及其编码,比较规则的集合。第一个字符集是ascll(american standard code for information interchange)。

mysql 开发基础系列14 字符集

 1.  选择合适的字符集

  对于数据库来说,字符集很重要,因为数据库存储的数据大部分是各种文字,字符集对数据库的存储,处理性能,以及日后系统的移植,推广都有会影响
  如何选择呢?
    UTF-8: 如果应用要处理各种各样的文字,或将发布使用不同语言的国家或地区,就应该选择 Unicode字符集,对于mysql 目前就是UTF-8。如果主要处理英文字符,仅有少量汉字数据,那么选择utf-8更好。因为gbk,ucs-2,utf-16对西文字符编码都是2字节,会造成不必要的开销。
    GBK: 如果数据库只需要支持一般中文,数据量很大,性能要求也很高,那应该选择双字节定长编码的中文字符集GBK。相对于uft-8而言,gbk比较“小”,每个汉字只占2个字节,而utf-8汉字编码需要3个字节,这样可以减少磁盘I/0, 数据库缓存,以及网络传输的时间。
    如果数据库需要做大量的字符运算,如比较,排序等,选择定长的字符集可能更好,因为定长字符集比变长处理速度快。如gbk固定双字节,utf-32固定4字节。
    客户端程序使用的字符集, 在数据库端应优先选择该字符集,避免因字符集转换带来性能开销和数据损失。

2. mysql 字符集

  mysql 支持几十种字符集。 如下图所示:

SHOW CHARACTER SET;

  mysql 开发基础系列14 字符集

3. mysql字符集的设置

  有4个级别的默认设置:服务器级,数据库级,表级,字段级。

   3.1 在服务器级,对my.cnf设置,在启动mysql服务

  mysql 开发基础系列14 字符集

  3.2 数据库级

   如果数据库中已有记录,修改字符集对原有的记录并没有影响,只对新记录使用。

 -- 查看当前数据库字符集
SHOW VARIABLES LIKE 'character%';

mysql 开发基础系列14 字符集

-- 修改数据库字符集 
ALTER DATABASE 数据库名 CHARACTER SET utf8;

  3.3 表级

   可以通过alter table来修改,如果表中已有记录,修改字符集对原有的记录并没有影响,只对新记录使用。

--  查看
SHOW CREATE TABLE t;

mysql 开发基础系列14 字符集

--  修改表的字符集
ALTER TABLE  表名 DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

         3.4 列级

                   这种控制一般机率比较小,只是给我们提供了一个灵活设置的手段。

4  字符集修改 

  如果在应用开始阶段没有正确设置字符集,在运行一段时间后发现不能满足要求需要调整,这时不能通过alter database character set 或alter tablename character set
命令进行,因为这两个命令都不会更新已有记录的字符集,对于已有的记录的字符集调整,需要先将数据导出,经过适当的调整重新导入后才完成。
  需要使用mysqldump工具来做导出导入,这里就不在演示只标记下:

以下是将iatin1字符集的数据库修改成GBK字符集的数据库过程
4.1 导出表结构:
mysqldump -uroot -p --default-character-set=gbk -d databasename> createtab.sql
4.2导出数据
    mysqldump -uroot -p --quick --no-create-info --extended-insert
    --default-character-set=latin1 databasename> data.sql
4.3  打开data.sql 将set names iatin1 修改成set names gbk
4.4 使用新的字符集创建新的数据库
        create database databasename default charset gbk;
4.5创建表 ,执行createtab.sql
      mysql  -uroot  -p databasename < createtab.sql
4.6导入数据,执行data.sql
      mysql  -uroot  -p databasename < data.sql