Python—对字符编码的初步认识
程序员文章站
2022-04-11 16:51:22
...
字符编码
Python主要识别文件内容,而不是关心拓展名—>解释器 例:cmd中输入 python xxx.txt也能运行 显示文本内容
字符—>(机器翻译)—>二进制
字符如何对应特定数字的标准,这个标准就是字符编码。
ASCII
GBK
Unicode
UTF-8(Unicode Transforma Format)
- 对于英文字符来说,1bytes
- 中文字符,3bytes
- 对于其他偏僻字符,更多的bytes存储
>>> b=bytes('城市学院',encoding='utf-8')
>>> b
b'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>> b1='城市学院'.encode('utf-8')
>>> b1
b'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>> b.decode('utf-8')
'城市学院'
>>> b.decode('gbk')
'鍩庡競瀛﹂櫌'
>>> b1.decode('utf-8')
'城市学院'
>>> b1.decode('gbk')
'鍩庡競瀛﹂櫌'
>>>