-
-
header('Content-type:text/html;charset=utf-8');
- /**
- * 统计中文字符串长度的函数
- * @param $str 要计算长度的字符串
- * @param $type 计算长度类型,0(默认)表示一个中文算一个字符,1表示一个中文算两个字符
- * @http://bbs.it-home.org
- *
- */
- function abslength($str)
- {
- if(empty($str)){
- return 0;
- }
- if(function_exists('mb_strlen')){
- return mb_strlen($str,'utf-8');
- }
- else {
- preg_match_all("/./u", $str, $ar);
- return count($ar[0]);
- }
- }
- $str = '脚本学堂欢迎大家的光临,ye!';
- $len = abslength($str);
- var_dump($len); //return 12
- $len = abslength($str,'1');
- echo '
'.$len; //return 22
- /*
- utf-8编码下截取中文字符串,参数可以参照substr函数
- @param $str 要进行截取的字符串
- @param $start 要进行截取的开始位置,负数为反向截取
- @param $end 要进行截取的长度
- */
- function utf8_substr($str,$start=0) {
- if(empty($str)){
- return false;
- }
- if (function_exists('mb_substr')){
- if(func_num_args() >= 3) {
- $end = func_get_arg(2);
- return mb_substr($str,$start,$end,'utf-8');
- }
- else {
- mb_internal_encoding("UTF-8");
- return mb_substr($str,$start);
- }
- }
- else {
- $null = "";
- preg_match_all("/./u", $str, $ar);
- if(func_num_args() >= 3) {
- $end = func_get_arg(2);
- return join($null, array_slice($ar[0],$start,$end));
- }
- else {
- return join($null, array_slice($ar[0],$start));
- }
- }
- }
- $str2 = 'wo要截取zhongwen';
- echo '
';
- echo utf8_substr($str2,0,-4); //return wo要截取zhon
- ?>
复制代码
2、支持gb2312,gbk,utf-8,big5 中文截取方法
-
-
/*
- * 中文截取,支持gb2312,gbk,utf-8,big5
- * bbs.it-home.org
- * @param string $str 要截取的字串
- * @param int $start 截取起始位置
- * @param int $length 截取长度
- * @param string $charset utf-8|gb2312|gbk|big5 编码
- * @param $suffix 是否加尾缀
- */
- public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
- {
- if(function_exists("mb_substr"))
- {
- if(mb_strlen($str, $charset) $slice = mb_substr($str, $start, $length, $charset);
- }
- else
- {
- $re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";
- $re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";
- $re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";
- $re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";
- preg_match_all($re[$charset], $str, $match);
- if(count($match[0]) $slice = join("",array_slice($match[0], $start, $length));
- }
- if($suffix) return $slice."…";
- return $slice;
- }
- ?>
复制代码
|