欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

php 实现emoji遇到的棘手问题,很棘手!

程序员文章站 2022-06-02 18:25:51
...
function str_emoji($dir,$str){
  if($dir){
    $str=json_encode($str);
    $str=preg_replace('#(\\\ud[0-9a-f]{3}|\\\u2(6|7)[0-9a-f]{2})#ie','addslashes("\\1")',$str);
    //emoji 5.0后,一个表情由两个字符组成
    $str=json_decode($str);
  }else{
    $str=preg_replace('#(u[0-9a-f]{4}u[0-9a-f]{4})#ie','iconv("UCS-2","UTF-8",pack("H4","\\1"))',$str);
    //此正则匹配ue415ue415形式的数据
    //不能将二进制转成\xf0\x9f\x98\x83形式的UTF-8
  }
  return $str;
};
//写进数据库
$content=str_emoji(true,$content);
//读取数据库
$content=str_emoji(false,$content);

下面问题来了。

iconv("UCS-2","UTF-8",pack("H4","\\1")) 不能将二进制专程UTF-8,怎么破????
另:数据库版本不能直接存储emoji,升级数据库是肯定不可行的方案。

参考文章:http://blog.mc-zone.me/article/322

回复内容:

function str_emoji($dir,$str){
  if($dir){
    $str=json_encode($str);
    $str=preg_replace('#(\\\ud[0-9a-f]{3}|\\\u2(6|7)[0-9a-f]{2})#ie','addslashes("\\1")',$str);
    //emoji 5.0后,一个表情由两个字符组成
    $str=json_decode($str);
  }else{
    $str=preg_replace('#(u[0-9a-f]{4}u[0-9a-f]{4})#ie','iconv("UCS-2","UTF-8",pack("H4","\\1"))',$str);
    //此正则匹配ue415ue415形式的数据
    //不能将二进制转成\xf0\x9f\x98\x83形式的UTF-8
  }
  return $str;
};
//写进数据库
$content=str_emoji(true,$content);
//读取数据库
$content=str_emoji(false,$content);

下面问题来了。

iconv("UCS-2","UTF-8",pack("H4","\\1")) 不能将二进制专程UTF-8,怎么破????
另:数据库版本不能直接存储emoji,升级数据库是肯定不可行的方案。

参考文章:http://blog.mc-zone.me/article/322

存数据库的时候 base_encode64() 取得的时候base_decode64()

mysql编码选择utf8mb4即可

数据库是mysql吧,把数据库和字段编码设置为utf8mb4,可以直接保存表情字符

相关标签: php emoji