欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

求汉语言,英文utf8下统一的计数和截取方法

程序员文章站 2022-03-27 18:23:22
...
求中文,英文utf8下统一的计数和截取方法
做网页,一行只有37个英文字符大小的地方,要判断是不是长了,不是就全显示,是就截取到17个中文字符或34个英文字符长的位置再加上三个点“...”做省略号,因为不能判断用户到时候用哪个国家的文字(没准还用俄语),所以需要一个统一的算法,不知道哪位大侠有办法,谢谢。
------解决思路----------------------
ThinkPHP框架中有一个截取函数比较不错

/**
+----------------------------------------------------------
* 字符串截取,支持中文和其他编码
+----------------------------------------------------------
* @static
* @access public
+----------------------------------------------------------
* @param string $str 需要转换的字符串
* @param string $start 开始位置
* @param string $length 截取长度
* @param string $charset 编码格式
* @param string $suffix 截断显示字符
+----------------------------------------------------------
* @return string
+----------------------------------------------------------
*/
function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)
{
if(function_exists("mb_substr"))
{
if ($suffix && strlen($str)>$length)
return mb_substr($str, $start, $length, $charset)."...";
else
return mb_substr($str, $start, $length, $charset);
}
elseif(function_exists('iconv_substr'))
{
if ($suffix && strlen($str)>$length)
return iconv_substr($str,$start,$length,$charset)."...";
else
return iconv_substr($str,$start,$length,$charset);
}

$re['utf-8'] = "/[\x01-\x7f]
------解决思路----------------------
[\xc2-\xdf][\x80-\xbf]
------解决思路----------------------
[\xe0-\xef][\x80-\xbf]{2}
------解决思路----------------------
[\xf0-\xff][\x80-\xbf]{3}/";
$re['gb2312'] = "/[\x01-\x7f]
------解决思路----------------------
[\xb0-\xf7][\xa0-\xfe]/";
$re['gbk'] = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe][\x40-\xfe]/";
$re['big5'] = "/[\x01-\x7f]
------解决思路----------------------
[\x81-\xfe]([\x40-\x7e]
------解决思路----------------------
\xa1-\xfe])/";
preg_match_all($re[$charset], $str, $match);
$slice = join("",array_slice($match[0], $start, $length));
if($suffix)
return $slice."…";
return $slice;
}

------解决思路----------------------
在浏览器中,一个汉字占两个西文字符的位置,这个说法是针对等宽字体而言的
在此前提下针对 utf-8 编码的中西文混合字符串的显示宽度(西文为1、中文为2)有如下计算公式
(按字节计的长度 - 按字计的长度) / 2 + 按字计的长度

比如 aa中国
按字节计的长度为 8
按字计的长度为 4
带入得 (8-4)/2+4 = 6
即 6 个显示单位

如果你需要先指定显示长度,就需要做循环试探了


其实 css 已经提供了更好的解决方案

DIV+CSS模板、后台模板、图片图标下载,CSS代码实例、CSS导航菜单、CSS图表

求汉语言,英文utf8下统一的计数和截取方法
------解决思路----------------------
text-overflow:ellipsis; 貌似IE only.
求汉语言,英文utf8下统一的计数和截取方法

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。

相关文章

相关视频