php从字符串中提取汉字字母和数字
程序员文章站
2022-04-06 20:39:52
...
我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。
回复内容:
我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。
这些特殊字符存不进mysql数据库也没什么意义
----有意义的,图标啊,字段类型用 varbinary 试试
其实是emoji表情符号存不进mysql
这种表情不处理直接存储到mysql5.5以下的版本会报错
可以修改数据库字符集为utf8mb4试试
github上有emoji unicode提取的范围,参照范围在过滤的时候进行匹配即可
首先,这些东西如果对你没有什么意义,不存就好了。
你提取出部分,也没什么用。
完整的存取,mysql是支持的,转换下字符集就好了,utf8mb4是utf8的超集,向下兼容的,修改这个是最完美的解决方法。
其次就是代码层面的转码,编码一下,再存,取出来反编码再展示,也可以。
最后就是这个方法,其实你只是存不进emoji而已。过滤掉emoji就OK。
public static function emoji($text) {
$clean_text = "";
// Match Emoticons
$regexEmoticons = '/[\x{1F600}-\x{1F64F}]/u';
$clean_text = preg_replace($regexEmoticons, '', $text);
// Match Miscellaneous Symbols and Pictographs
$regexSymbols = '/[\x{1F300}-\x{1F5FF}]/u';
$clean_text = preg_replace($regexSymbols, '', $clean_text);
// Match Transport And Map Symbols
$regexTransport = '/[\x{1F680}-\x{1F6FF}]/u';
$clean_text = preg_replace($regexTransport, '', $clean_text);
// Match Miscellaneous Symbols
$regexMisc = '/[\x{2600}-\x{26FF}]/u';
$clean_text = preg_replace($regexMisc, '', $clean_text);
// Match Dingbats
$regexDingbats = '/[\x{2700}-\x{27BF}]/u';
$clean_text = preg_replace($regexDingbats, '', $clean_text);
$regexDingbats = '/[\x{231a}-\x{23ab}\x{23e9}-\x{23ec}\x{23f0}-\x{23f3}]/u';
$clean_text = preg_replace($regexDingbats, '', $clean_text);
return $clean_text;
}
来源在这里
下一篇: 微信公众平台开发之关注/取消关注事件