欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  Java

Unicode和UTF-8区别是什么

程序员文章站 2022-03-24 18:51:39
...
本篇文章给大家带来的内容是介绍Unicode和UTF-8是什么,让大家了解Unicode和UTF-8之间的区别(差异)。有一定的参考价值,有需要的朋友可以参考一下,希望对你们有所帮助。

什么是Unicode(统一码)?

Unicode 是用两个字节表示每个字符的字符编码方案。Unicode给每个字符和符号在 0 到 65,535 (216 – 1) 范围内定义了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。

什么是UTF-8?

UTF-8 是一种用于将宽字符值转换为字节流的 Unicode 的标准机制,一种编码格式;可以用1到6个字节来编码Unicode字符。

Unicode和UTF-8的区别

Unicode是一种字符集,而,UTF-8是一种编码规则。

字符集是具有唯一编号的字符列表(这些编号有时称为“码位 / 码点 / Code Point”)。简单来说,就是为每一个「字符」分配一个唯一的 ID。例如,在Unicode字符集中,A的数字为41。

编码规则:是将「码位」转换为字节序列的规则(编码/解码 可以理解为 加密/解密 的过程),是一种将数字列表转换为二进制的算法,因此可以将其存储在磁盘上。

例如,UTF-8会像这样翻译数字序列:1,2,3,4:

00000001 00000010 00000011 00000100

我们的数据现在已翻译成二进制文件,现在可以保存到磁盘。

Unicode和UTF-8关系图:

Unicode和UTF-8区别是什么

结论:

UTF-8是用于将二进制数据转换为数字的编码;Unicode是用于将数字转换为字符的字符集。

以上就是本篇文章的全部内容,希望能对大家的学习有所帮助。更多相关视频教程,可访问:java教程

以上就是Unicode和UTF-8区别是什么的详细内容,更多请关注其它相关文章!

相关标签: Unicode UTF-8