PHP 检测字符串的编码是否是UTF-8编码的函数 check
程序员文章站
2022-04-11 22:13:23
...
找了一下还以为真的没有,然后自己用 网上说的那种 mb_detect_encoding(),很多是通过了,但是还是有几个测试根本就无法判断成功。 后来我自己终于在官网给出的里面找到了一个函数 check_utf8()。现在备份保留下,希望对大家有帮助。 function check_utf8($s
找了一下还以为真的没有,然后自己用 网上说的那种 mb_detect_encoding(),很多是通过了,但是还是有几个测试根本就无法判断成功。
后来我自己终于在官网给出的里面找到了一个函数 check_utf8()。现在备份保留下,希望对大家有帮助。
function check_utf8($str) { $len = strlen($str); for($i = 0; $i 128) { if (($c > 247)) return false; elseif ($c > 239) $bytes = 4; elseif ($c > 223) $bytes = 3; elseif ($c > 191) $bytes = 2; else return false; if (($i + $bytes) > $len) return false; while ($bytes > 1) { $i++; $b = ord($str[$i]); if ($b 191) return false; $bytes--; } } } return true; } // end of check_utf8
PS:结尾的时候穿插一个事情。网上其实流传最广的应该是这个:
因为中国的那些中文网站大部分都是采集站,自动采集然后发布。
真的害怕有一天,错误说的太多了居然可以成为真理,那这可怕。