欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

利用JS如何计算字符串所占字节数示例代码

程序员文章站 2022-05-14 19:03:38
前言 在工作中是不是经常会遇到字符串,但是要求控制字节数的需求?因为很多时候数据库中对字节数有控制,所以在前端过程中就需要判断一下,今天我们来分享一下。 本文主要给大家...

前言

在工作中是不是经常会遇到字符串,但是要求控制字节数的需求?因为很多时候数据库中对字节数有控制,所以在前端过程中就需要判断一下,今天我们来分享一下。

本文主要给大家介绍了关于js计算字符串所占字节数的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。

示例代码

/**
 * 计算字符串所占的内存字节数,默认使用utf-8的编码方式计算,也可制定为utf-16
 * utf-8 是一种可变长度的 unicode 编码格式,使用一至四个字节为每个字符编码
 * 
 * 000000 - 00007f(128个代码)  0zzzzzzz(00-7f)        一个字节
 * 000080 - 0007ff(1920个代码)  110yyyyy(c0-df) 10zzzzzz(80-bf)    两个字节
 * 000800 - 00d7ff 
 00e000 - 00ffff(61440个代码) 1110xxxx(e0-ef) 10yyyyyy 10zzzzzz   三个字节
 * 010000 - 10ffff(1048576个代码) 11110www(f0-f7) 10xxxxxx 10yyyyyy 10zzzzzz 四个字节
 * 
 * 注: unicode在范围 d800-dfff 中不存在任何字符
 * {@link http://zh.wikipedia.org/wiki/utf-8}
 * 
 * utf-16 大部分使用两个字节编码,编码超出 65535 的使用四个字节
 * 000000 - 00ffff 两个字节
 * 010000 - 10ffff 四个字节
 * 
 * {@link http://zh.wikipedia.org/wiki/utf-16}
 * @param {string} str 
 * @param {string} charset utf-8, utf-16
 * @return {number}
 */
  
 var sizeof = function(str, charset){
  var total = 0,
   charcode,
   i,
   len;
  charset = charset ? charset.tolowercase() : '';
  if(charset === 'utf-16' || charset === 'utf16'){
   for(i = 0, len = str.length; i < len; i++){
    charcode = str.charcodeat(i);
    if(charcode <= 0xffff){
     total += 2;
    }else{
     total += 4;
    }
   }
  }else{
   for(i = 0, len = str.length; i < len; i++){
    charcode = str.charcodeat(i);
    if(charcode <= 0x007f) {
     total += 1;
    }else if(charcode <= 0x07ff){
     total += 2;
    }else if(charcode <= 0xffff){
     total += 3;
    }else{
     total += 4;
    }
   }
  }
  return total;
 }

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。