中文编码格式有哪些(讲解汉字内码正确形式)
程序员文章站
2023-11-25 09:57:46
在码农的世界中除了bug,还有一个比较头疼的事情,那就是中文编码格式,对于普通人,你现在看到的中文,或者说你看到的所有中文,其实都是中文,你可能根本就不关心它是什么编码格式,但是程序员却不得不关注中文...
在码农的世界中除了bug,还有一个比较头疼的事情,那就是中文编码格式,对于普通人,你现在看到的中文,或者说你看到的所有中文,其实都是中文,你可能根本就不关心它是什么编码格式,但是程序员却不得不关注中文的编码格式,或者代码的编码格式,不然就会出现下面这种:
可能已经乱瞎你们的眼了,其实它们正常如下:
这就是编码格式导致的,乱到火星人也无法认识,编码不仅仅会导致显示出现短路,还会让程序无法正常运行,特别是在加解密或者验签中,如果不按规定的编码格式编码,经常会遇见:签名失败,验签不符这种的错误。今天分享的是如何证明编码的格式:第一步:复制乱码的字符串(这个是还不要叫中文了,谁也不认识了),利用ue转16进制查看乱码处对应的16进制。如查看‘一个程序员’对应的16进制:
第二步:在java代码中查询‘一个程序员’对应的utf-8和gbk 16进制表示; 比较就可以发现ue中的‘一个程序员’的编码格式是gbk的,这样就可以证明对应中文的编码格式了。获取字符串编码格式的16进制的java代码如下: