欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL 支持 emoji 图标存储

程序员文章站 2023-11-02 15:39:40
在MySLQ中 UPDATA 和 INSERT 数据的时候,如果数据上面带有emoji图标,例如:?、?、? 很容易更新或者插入不成功,导致报错。 1 2 Error: ER_TRUNCATED_WRONG_VALUE_FOR_FIELD: Incorrect string value: '\xF0 ......

 

在myslq中 updata 和 insert 数据的时候,如果数据上面带有emoji图标,例如:?、?、? 很容易更新或者插入不成功,导致报错。

 

1

2

error: er_truncated_wrong_value_for_field:

incorrect string value: '\xf0\x9f\x91\xbd\xf0\x9f...' for column 'name' at row

都快崩溃了,但是还好终于解决了这种鬼问题。资料显示原因是,mysql 5.5 之前, utf8 编码只支持1-3个字节,只支持bmp这部分的unicode编码区,而emoji图标恰好是4个字节的编码进行存储。从mysql5.5开始,可支持4个字节utf编码utf8mb4,一个字符最多能有4字节,所以能支持更多的字符集。所以要解决问题,必需把数据库表字符编码全部改成utf8mb4。

推荐:

常用字符集

ascii:美国信息互换标准编码;英语和其他西欧语言;单字节编码,7位表示一个字符,共128字符。

gbk:双字节,汉字内码扩展规范;中日韩汉字、英文、数字;双字节编码;共收录了21003个汉字,gb2312的扩展。

utf-8:unicode标准的可变长度字符编码;unicode标准(统一码),业界统一标准,包括世界上数十种文字的系统;

utf-8:使用一至三个字节为每个字符编码。

utf8mb4:存储四个字节,应用场景用于存储emoji表情,因为可以emoji表情四个字节。

utf8mb4:mysql版本 > 5.5.3 。

其他常见字符集:utf-32,utf-16,big5,latin1

数据库中的字符集包含两层含义

各种文字和符号的集合,包括各国家文字、标点符号、图形符号、数字等。

字符的编码方式,即二进制数据与字符的映射规则。

系统环境

mysql 5.7.14

mac osx 10.11.6

首先备份

升级数据之前备份您服务器上的所有数据,保持良好习惯,安全第一!

升级您的mysql

新的数据库可以在这里下载upgrade the mysql server to v5.5.3+

修改您的数据库、表、字段

1

2

3

4

5

6

7

8

# 对每一个数据库:

alter database 这里数据库名字 character set = utf8mb4 collate = utf8mb4_unicode_ci;

# 对每一个表:

alter table 这里是表名字 convert to character set utf8mb4 collate utf8mb4_unicode_ci;

# 对每一个字段:

alter table 这里是表名字 change 字段名字 重复字段名字 varchar(191) character set utf8mb4 collate utf8mb4_unicode_ci;

# 上面一句或者使用modify来更改

alter table 这里是表名字 modify 字段名字 varchar(50) character set utf8mb4 collate utf8mb4_unicode_ci default '';

utf8mb4完全向后兼容utf8,无乱码或其他数据丢失的形式出现。理论上是可以放心修改,如果您不放心修改,您可以拿备份恢复数据,然后让程序员处理这种兼容emoji存储问题,存的时候过滤一遍转成base64,然后取的时候转回来?... 还是修改数据库比较方便。

检查你的字段和索引

不要将所有的都设置成utf8mb4,这个冒得必要。我只在我某些字段类型为varchar的时候才设置成utf8mb4。

修改mysql配置文件

这个地方最坑,我在我mac osx 系统上找不到/etc/my.cnf 它根本不存在,所以我们需要创建这样一个文件并修改它。

1

2

3

4

5

6

7

# 进入这个目录,

# 在这个目录下面有个后缀为`.cnf`的文件

cd /usr/local/mysql/support-files/

# 将这个文件复制到`etc`目录中并将名字命名为`my.cnf`

sudo cp my-default.cnf /etc/my.cnf

# 然后编辑`my.cnf`文件,将下面内容复制到里面。

sudo vim /etc/my.cnf

mysql configuration file (/etc/my.cnf):

1

2

3

4

5

6

7

8

[client]

default-character-set = utf8mb4

[mysql]

default-character-set = utf8mb4

[mysqld]

character-set-client-handshake = false

character-set-server = utf8mb4

collation-server = utf8mb4_unicode_ci

重启mysql

重启步骤很重要,不然没有任何效果。

启动:/usr/local/mysql/support-files/mysql.server start

停止:/usr/local/mysql/support-files/mysql.server stop

重启:/usr/local/mysql/support-files/mysql.server restart

系统中可以以这种形式重启、停止或启动

1

2

3

service mysqld stop

service mysqld start

service mysqld restart

查看是否设置成功

通过下面命令查询是否设置成功!

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

# 登陆mysql进行查询

mysql> show variables where variable_name like 'character\_set\_%' or variable_name like 'collation%';

# 运行上面代码显示下面结果

# +--------------------------+--------------------+

# | variable_name            | value              |

# +--------------------------+--------------------+

# | character_set_client     | utf8mb4            |

# | character_set_connection | utf8mb4            |

# | character_set_database   | utf8mb4            |

# | character_set_filesystem | binary             |

# | character_set_results    | utf8mb4            |

# | character_set_server     | utf8mb4            |

# | character_set_system     | utf8               |

# | collation_connection     | utf8mb4_unicode_ci |

# | collation_database       | utf8mb4_unicode_ci |

# | collation_server         | utf8mb4_unicode_ci |

# +--------------------------+--------------------+

# 查看表的情况

mysql>  show full columns  from  users_profile;

到这一步表示你成功了!恭喜你!~

修复和优化表

我跑到这一步其实没有任何必要修复和优化表,为了保险起见,我还是运行了这两条命令,虽然不知道它有什么卵用,放在这里做个笔记吧。

1

2

repair table 表名字;

optimize table 表名字;