欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Python—对字符编码的初步认识

程序员文章站 2022-04-11 16:51:22
...

字符编码

Python主要识别文件内容,而不是关心拓展名—>解释器 例:cmd中输入 python xxx.txt也能运行 显示文本内容

字符—>(机器翻译)—>二进制

字符如何对应特定数字的标准,这个标准就是字符编码。

ASCII

GBK

Unicode

UTF-8(Unicode Transforma Format)

  • 对于英文字符来说,1bytes
  • 中文字符,3bytes
  • 对于其他偏僻字符,更多的bytes存储
>>> b=bytes('城市学院',encoding='utf-8')
>>> b
b'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>> b1='城市学院'.encode('utf-8')
>>> b1
b'\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
>>> b.decode('utf-8')
'城市学院'
>>> b.decode('gbk')
'鍩庡競瀛﹂櫌'
>>> b1.decode('utf-8')
'城市学院'
>>> b1.decode('gbk')
'鍩庡競瀛﹂櫌'
>>>