js处理包含中文的字符串

程序员文章站 2022-04-09 19:56:16

...

场景：

js中String类型自带的属性length获取的是字符串的字符数目，但是前端经常会需要限制字符串的显示长度，一个中文字符又大概占两个英文小写字符的显示位置，所以中英文混合的情况下用length值来判断显示长度往往并不正确。

常规的解决办法是遍历字符串，中文字符计长度2，非中文字符计长度1，通过新计算出来长度总和来限制字符串的显示长度。看代码↓↓↓

var Tools ={    //是否包含中文
    hasZh: function(str){        
    for(var i = 0;i < str.length; i++)
        {            
        if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
                return true;            
                return false;
        }
    },    //重新计算长度，中文+2，英文+1
    getlen: function(str){       
    var strlen = 0;        
    for(var i = 0;i < str.length; i++)
        {            
        if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
                strlen += 2;            
                else
                strlen++;
        }        return strlen;
    },    //限制长度
    limitlen: function(str, len){        
    var result = "";        
    var strlen = 0;        
    for(var i = 0;i < str.length; i++)
        {            
        if(str.charCodeAt(i) > 255) //如果是汉字，则字符串长度加2
                strlen += 2;            
                else
                strlen++;

            result += str.substr(i,1);            
            if(strlen >= len){                
            break;
            }
        }        return result;
    }
}

这种方法的原理是根据中英文的unicode编码范围不同来判断的，中文占2个字节，英文占1个字节，所以中文的unicode编码值肯定大于2^8-1=255。

上述方法可以更严谨一点：就是考虑unicode编码范围，具体的范围可以戳Unicode Table

PS: 汉字的unicode编码范围16进制为4E00-9FA5，10进制则为：19968-40869，即判断中文的准确表达式为：

str.charCodeAt(i)>=19968 && str.charCodeAt(i)<=40869

插一句不太严谨的话，代码不用限制太严谨的范围，毕竟你不知道用户(测试)会输哪些奇怪的东西。

以上就是js处理包含中文的字符串的详细内容，更多请关注其它相关文章！

相关标签： javascript 字符串中文

上一篇： PHP将二维数组按照apname的键值排序重组成新的二维数组

下一篇： MySQL默认INFORMATION_SCHEMA,MySQL,TEST三个数据库用途

js处理包含中文的字符串

JS字符串false转boolean的方法(推荐)

php对包含html标签的字符串进行截取的函数分享

MS SQL 实现验证字符串是否包含有大小写字母的功能

Shell中处理包含空格的文件名实例

D3.js的基础部分之数组的处理数组的排序和求值(v3版本)

js字符串包含判断（前端字符串包含方法）

在Python中关于中文编码问题的处理建议

JS实现生成由字母与数字组合的随机字符串功能详解

js截取第一个字符串（javascript截取字符串的方法）

js以逗号分割字符串（js分割字符串的方法）