欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

php从字符串中提取汉字字母和数字

程序员文章站 2022-04-06 20:39:52
...

php从字符串中提取汉字字母和数字

我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。

回复内容:

php从字符串中提取汉字字母和数字

我通过微信接口读用户的昵称,但好多名字都是一些特殊字符,如上图,这些特殊字符存不进mysql数据库也没什么意义。所以我想过滤一下,名字字符中只把汉字字母与数字提取出来。这个用PHP怎么写。

这些特殊字符存不进mysql数据库也没什么意义
----有意义的,图标啊,字段类型用 varbinary 试试

其实是emoji表情符号存不进mysql
这种表情不处理直接存储到mysql5.5以下的版本会报错
可以修改数据库字符集为utf8mb4试试
github上有emoji unicode提取的范围,参照范围在过滤的时候进行匹配即可

首先,这些东西如果对你没有什么意义,不存就好了。

你提取出部分,也没什么用。

完整的存取,mysql是支持的,转换下字符集就好了,utf8mb4是utf8的超集,向下兼容的,修改这个是最完美的解决方法。

其次就是代码层面的转码,编码一下,再存,取出来反编码再展示,也可以。

最后就是这个方法,其实你只是存不进emoji而已。过滤掉emoji就OK。

public static function emoji($text) {
        $clean_text = "";

        // Match Emoticons
        $regexEmoticons = '/[\x{1F600}-\x{1F64F}]/u';
        $clean_text = preg_replace($regexEmoticons, '', $text);

        // Match Miscellaneous Symbols and Pictographs
        $regexSymbols = '/[\x{1F300}-\x{1F5FF}]/u';
        $clean_text = preg_replace($regexSymbols, '', $clean_text);

        // Match Transport And Map Symbols
        $regexTransport = '/[\x{1F680}-\x{1F6FF}]/u';
        $clean_text = preg_replace($regexTransport, '', $clean_text);

        // Match Miscellaneous Symbols
        $regexMisc = '/[\x{2600}-\x{26FF}]/u';
        $clean_text = preg_replace($regexMisc, '', $clean_text);

        // Match Dingbats
        $regexDingbats = '/[\x{2700}-\x{27BF}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        $regexDingbats = '/[\x{231a}-\x{23ab}\x{23e9}-\x{23ec}\x{23f0}-\x{23f3}]/u';
        $clean_text = preg_replace($regexDingbats, '', $clean_text);

        return $clean_text;
    }

来源在这里

相关标签: php