欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

utf-8编码下的中文字有没有字节长度不是3的

程序员文章站 2022-05-21 18:37:42
...
如题目所述,到现在为止以utf-8编码的所有汉字中有没有字节长度不是3的(2或者4)?

回复内容:

如题目所述,到现在为止以utf-8编码的所有汉字中有没有字节长度不是3的(2或者4)?

占2个字节的:〇

占3个字节的:基本等同于GBK,含21000多个汉字

占4个字节的:中日韩超大字符集里面的汉字,有5万多个

一个utf8数字占1个字节

一个utf8英文字母占1个字节

摘自:http://blog.csdn.net/chummyhe89/article/details/7777613

相关标签: php