求汉语言,英文utf8下统一的计数和截取方法
程序员文章站
2022-04-28 08:51:35
...
求中文,英文utf8下统一的计数和截取方法
做网页,一行只有37个英文字符大小的地方,要判断是不是长了,不是就全显示,是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号,因为不能判断用户到时候用哪个国家的文字(没准还用俄语),所以需要一个统一的算法,不知道哪位大侠有办法,谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错
------解决思路----------------------
在浏览器中,一个汉字占两个西文字符的位置,这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度(西文为1、中文为2)有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度
比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位
如果你需要先指定显示长度,就需要做循环试探了
其实 css 已经提供了更好的解决方案
------解决思路----------------------
text-overflow:ellipsis; 貌似IE only.
做网页,一行只有37个英文字符大小的地方,要判断是不是长了,不是就全显示,是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号,因为不能判断用户到时候用哪个国家的文字(没准还用俄语),所以需要一个统一的算法,不知道哪位大侠有办法,谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错
/**
+----------------------------------------------------------
* 字符串截取,支持中文和其他编码
+----------------------------------------------------------
* @static
* @access public
+----------------------------------------------------------
* @param string $str 需要转换的字符串
* @param string $start 开始位置
* @param string $length 截取长度
* @param string $charset 编码格式
* @param string $suffix 截断显示字符
+----------------------------------------------------------
* @return string
+----------------------------------------------------------
*/
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
if(function_exists("mb_substr"))
{
if ($suffix && strlen($str)>$length)
return mb_substr($str, $start, $length, $charset)."...";
else
return mb_substr($str, $start, $length, $charset);
}
elseif(function_exists('iconv_substr'))
{
if ($suffix && strlen($str)>$length)
return iconv_substr($str,$start,$length,$charset)."...";
else
return iconv_substr($str,$start,$length,$charset);
}
$re['utf-8'] = "/[\x01-\x7f]
------解决思路----------------------
[\xc2-\xdf][\x80-\xbf]
------解决思路----------------------
[\xe0-\xef][\x80-\xbf]{2}
------解决思路----------------------
[\xf0-\xff][\x80-\xbf]{3}/";
$re['gb2312'] = "/[\x01-\x7f]
------解决思路----------------------
[\xb0-\xf7][\xa0-\xfe]/";
$re['gbk'] = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe][\x40-\xfe]/";
$re['big5'] = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe]([\x40-\x7e]
------解决思路----------------------
\xa1-\xfe])/";
preg_match_all($re[$charset], $str, $match);
$slice = join("",array_slice($match[0], $start, $length));
if($suffix)
return $slice."…";
return $slice;
}
------解决思路----------------------
在浏览器中,一个汉字占两个西文字符的位置,这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度(西文为1、中文为2)有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度
比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位
如果你需要先指定显示长度,就需要做循环试探了
其实 css 已经提供了更好的解决方案
DIV+CSS模板、后台模板、图片图标下载,CSS代码实例、CSS导航菜单、CSS图表
------解决思路----------------------
text-overflow:ellipsis; 貌似IE only.
相关文章
相关视频