欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

javascript - unicode和UTF-8,ISO8859-1等是什么关系?

程序员文章站 2022-05-10 14:02:05
...
首先这两个究竟是什么关系?还有就是编码和实现是什么关系?有点没理解这些概念= =

回复内容:

首先这两个究竟是什么关系?还有就是编码和实现是什么关系?有点没理解这些概念= =

又有人问这样的问题,我就只好贴链接了。
https://segmentfault.com/q/1010000004240543/a-1020000004241029

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

谢谢阮一峰的博文http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

总结了一下,区别大概就是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。UTF-8等就是字符集的存储方式名称。一个是符号集,一个是存储方式,这就是区别。

ANSI 和 unicode 是两种不同的表示字符的标准体系。

ISO8859-1 还有GBK 这类的都是衍生自 ANSI的,这类编码是针对某种文字而建立的标准,一般只会兼容ASCII。

UTF-8、UTF-16 这些都是unicode标准的编码,旨在包含世界上所有的语言文字,以达到可以在不同语言环境的电脑上正常显示文字而不乱码,这类的编码因为包含的字符很多,所以占用空间会相对大一些。

简而言之,我们经常接触到的包括UTF-8,本质都是一样的,就是对unicode的一种包装,因而编码之间的转换,需要先转换成unicode然后再转换。