欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

PHP 中文处理

程序员文章站 2022-06-03 07:58:08
...
一、编码范围
1. GBK (GB2312/GB18030)
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文

2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)
ps: 韩文是大于[\u9fa5]的字符


正则例子:

//判断内容里有没有中文-GBK (PHP)function check_is_chinese($s){return preg_match('/[\x80-\xff]./', $s);} //获取字符串长度-GBK (PHP)function gb_strlen($str){$count = 0;for($i=0; $i 127) {$count++;if($value>= 192 && $value = 224 && $value = 240 && $value = $position && $start_position> $i){$start_position = $i;$start_byte = $count;}if(($count-$start_byte)>=$length) {$end_position = $i;break;}$value = ord($str[$i]);if($value> 127){$count++;if($value>= 192 && $value = 224 && $value = 240 && $value = 127 and temp[t]  0x3130 && str.charCodeAt(i) = 0xAC00 && str.charCodeAt(i)       

  

相关标签: PHP 中文处理