欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

mysql - 如何用PHP匹配并替换iOS标准的emoji表情符号

程序员文章站 2022-06-04 18:31:43
...
遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配
preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches);
var_dump($matches);

打印出来是个 NULL

求助各位大神,怎么才能匹配这种表情符号啊。。。

补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。

补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

回复内容:

遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配

preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches);
var_dump($matches);

打印出来是个 NULL

求助各位大神,怎么才能匹配这种表情符号啊。。。

补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。

补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

试试这个

preg_match('/\x{d83d}\x{de04}/u', $str_with_smail_emotion, $matches);

其实已经有个开源转换程序了。
http://code.iamcal.com/php/emoji/
https://github.com/iamcal/php-emoji

希望这个能帮到你。
http://*.com/questions/12807176/php-writing-a-simple-removeemoji-function#

参考这篇文章 http://www.bubuko.com/infodetail-1022211.html
里边推导了一个公式,可以把 0xd83d0xde04 转成 1f604 ,而 U+1F604 就是 Unified 编码的笑脸表情代码。
文中是 js 的函数,我提取出来了关键几行代码,转成 PHP 代码如下:

$h = 0xd83d; //高位
$l = 0xde04; //低位
$code = ($h - 0xD800) * 0x400 + 0x10000 + $l - 0xDC00; // 转换算法
echo "U+" . strtoupper(dechex($code));
//echo 结果是 U+1F604

另外不同编码方式的转换,@seeyoup 已经说了