求汉语言，英文utf8下统一的计数和截取方法

程序员文章站 2022-04-28 08:51:35

...

求中文，英文utf8下统一的计数和截取方法
做网页，一行只有37个英文字符大小的地方，要判断是不是长了，不是就全显示，是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号，因为不能判断用户到时候用哪个国家的文字（没准还用俄语），所以需要一个统一的算法，不知道哪位大侠有办法，谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错

/**
 +----------------------------------------------------------
 * 字符串截取，支持中文和其他编码
 +----------------------------------------------------------
 * @static
 * @access public
 +----------------------------------------------------------
 * @param string $str 需要转换的字符串
 * @param string $start 开始位置
 * @param string $length 截取长度
 * @param string $charset 编码格式
 * @param string $suffix 截断显示字符
 +----------------------------------------------------------
 * @return string
 +----------------------------------------------------------
 */
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
    if(function_exists("mb_substr"))
	{
		if ($suffix && strlen($str)>$length)
			return mb_substr($str, $start, $length, $charset)."...";
        else
			return mb_substr($str, $start, $length, $charset);
    }
    elseif(function_exists('iconv_substr'))
	{
		if ($suffix && strlen($str)>$length)
			return iconv_substr($str,$start,$length,$charset)."...";
        else
			return iconv_substr($str,$start,$length,$charset);
    }

    $re['utf-8']   = "/[\x01-\x7f]
------解决思路----------------------
[\xc2-\xdf][\x80-\xbf]
------解决思路----------------------
[\xe0-\xef][\x80-\xbf]{2}
------解决思路----------------------
[\xf0-\xff][\x80-\xbf]{3}/";
    $re['gb2312'] = "/[\x01-\x7f]
------解决思路----------------------
[\xb0-\xf7][\xa0-\xfe]/";
    $re['gbk']    = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe][\x40-\xfe]/";
    $re['big5']   = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe]([\x40-\x7e]
------解决思路----------------------
\xa1-\xfe])/";
    preg_match_all($re[$charset], $str, $match);
    $slice = join("",array_slice($match[0], $start, $length));
    if($suffix)
		return $slice."…";
    return $slice;
}

------解决思路----------------------
在浏览器中，一个汉字占两个西文字符的位置，这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度（西文为1、中文为2）有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度

比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位

如果你需要先指定显示长度，就需要做循环试探了

其实 css 已经提供了更好的解决方案


DIV+CSS模板、后台模板、图片图标下载，CSS代码实例、CSS导航菜单、CSS图表

------解决思路----------------------
text-overflow:ellipsis; 貌似IE only.

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn核实处理。