字符编码ascii、unicode、utf-‐8、gbk 的关系
程序员文章站
2023-11-16 11:30:10
ASIIC码: 计算机是美国人发明和最早使用的,他们为了解决计算机处理字符串的问题,就将数字字母和一些常用的符号做成了一套编码,这个编码就是ASIIC码。ASIIC码包括数字大小写字母和常用符号,一共128个,1字节(byte)=8bit,8bit能表示的最大数是256,所以ASIIC编码中一个字符 ......
asiic码:
计算机是美国人发明和最早使用的,他们为了解决计算机处理字符串的问题,就将数字字母和一些常用的符号做成了一套编码,这个编码就是asiic码。asiic码包括数字大小写字母和常用符号,一共128个,1字节(byte)=8bit,8bit能表示的最大数是256,所以asiic编码中一个字符的大小就是1个字节
unicode编码:
计算机进入中国后,asiic完全不够用,于是我们就制定了自己的gb2312编码,把汉字编码了进去。类似的在各国都有相同的情况,各国都开始制定自己的一套编码,计算机的编码越来越庞大,越来越乱,为了解决这一问题,unicode应运而生。unicode将各国文字统一编码,所以unicode编码可以看做是asiic的扩展。特点:速度快,但是占内存大。
utf-8:
utf-8编码可以理解成unicode编码的一种升级,为了节省存储空间。utf-8根据实际使用情况调节存储编码的位数,将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存等等
gbk:
gbk也是基于unicode编码的进一步优化,gbk的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示。
推荐阅读
-
字符编码ascii、unicode、utf-‐8、gbk 的关系
-
字符编码 ASCII unicode UTF-8
-
php截取字符串之截取utf8或gbk编码的中英文字符串示例
-
各种编码格式(GB2312,GBK,GB18030,unicode,utf-8)之间的关系
-
字符集、字符编码、国际化、本地化简要总结(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)
-
字符串编码:ASCII、GB系列、Unicode、UTF-8
-
字符编码:ASCII,Unicode 和 UTF-8
-
ASCII、Unicode和UTF-8编码的区别
-
python3 之 字符串编码小结(Unicode、utf-8、gbk、gb2312等)
-
字符编码ascii、unicode、utf-‐8、gbk 的关系