PHP开发中涉及到emoji表情的几种处理方法
一般Mysql表设计时,都是用UTF8字符集的。把带有emoji的昵称字段往里面 insert一下就没了,整个字段变成了空字符串。这是怎么回事呢?
原来是因为Mysql的utf8字符集是3字节的,而emoji是4字节,这样整个昵称就无法存储了。这要怎么办呢?我来介绍几种方法
1、使用utf8mb4字符集
如果你的mysql版本 >=5.5.3,你大可直接将 utf8直接升级为 utf8mb4字符集
这种4字节的utf8编码可完美兼容旧的3字节utf8字符集,并且可以直接存储emoji表情,是最好的解决方案
至于字节增大带来的性能损耗,我看过一些评测,几乎是可以忽略不计的
2、使用base64编码
如果你因为某些原因无法使用utf8mb4的话,你还可以使用 base64来曲线救国
使用例如 base64_encode之类的函数编码过后的emoji可以直接存储在utf8字节集的数据表中,取出时decode一下即可
3、干掉emoji表情
emoji表情是个麻烦的东西,即使你能存储,也不一定能完美显示。在iOS以外的平台上,例如PC或者android。如果你需要显示emoji,就得准备一大堆emoji图片并使用第三方前端类库才行。即便如此,还是可能因为emoji图片不够全而出现无法显示的情况在大多数业务场景下,emoji也不是非要不可的。我们可以适当地考虑干掉它,节约各种成本
经过一番苦苦的google,终于找到靠谱能用的代码:
// 过滤掉emoji表情function filterEmoji($str){ $str = preg_replace_callback( '/./u', function (array $match) { return strlen($match[0]) >= 4 ? '' : $match[0]; }, $str); return $str; }
基本思想就是遍历字符串中的每个字符,如果该字符的长度为4个字节,就将其删除。
转载自: pein0119
像我最近做的一个小项目,就是用方法3解决的,方便省事
本文同时刊登于我的博客 超能小紫,如果喜欢请常来玩哦
上一篇: 对Python 数组的切片操作详解
下一篇: Linux下如何处理文本文件内容中的^M