欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

PHP中截取中文乱码解决办法

程序员文章站 2022-05-25 19:12:27
...
如果ASCii码大于0xa0就是半个汉字;了解substr()、mb_substr()、ord()。 现在常用的编码格式是UTF8,GBK,GBK2312,BIG5。GBK是GBK2312的升级。现在我开发中遇到的基本都是UTF8,GBK常用在论坛BBS上。今天自己写了下UTF8的,测试下还说的过去,毕竟从网上拷下来的是可以用,但是如果有时间最好还是自己写一下,这样只有到自己手里的才是自己的。

最简的就是利用:例一

例二:


英文的话没有问题,但是中文就出问题了,下面我们使用mb_substr函数处理。

首先定义自己的函数:

 $length) {
        $str = "";
        $len = $start + $length;
        for ($i = $start; $i  0xa0) {
                $str.= substr($string, $i, 2);
                $i++;
            } else {
                $str.= substr($string, $i, 1);
            }
        }
        return $str . '…';
    } else {
        return $string;
    }
}
?>

还有一个问题要注意,使用这种方法的时候,你的标签对里的charset只有设成中文的编码才可以,如GBK,GB2312。

下面自己常用的一个中英文字符截取函数,自定义截取中文字符串函数,基本上就是仿照mb_substr写个函数,直接调用罢了,以下为我找到的代码,其实很简单:

= 161)) //是汉语
        {
            $start_index+= 2;
        } else
        //是英文
        {
            $start_index+= 1;
        }
    }
    $chr_index = $start_index;
    //截取
    for ($i = 0; $i = 161) {
            $return_str{$i} = chr($asc);
            $return_str{$i + 1} = chr(ord($str_input{$chr_index + 1}));
            $len+= 1; //结束条件加1
            $i++; //位置偏移量加1
            $chr_index+= 2;
            continue;
        } else {
            $return_str{$i} = chr($asc);
            $chr_index+= 1;
        }
    }
    return trim($return_str);
} //end of substr_cn
?>



本文地址:

转载随意,但请附上文章地址:-)