欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python3 字符串 转 ascii码

程序员文章站 2022-07-14 18:15:52
...

在这里先解释一下ASCII,Unicode 和 UTF-8这三者的关系

最早出现的是ASCII,一共包含128个字符(一个字节可以表示256种状态,但第一位所有默认为0,所以只有128种)。在接下来计算机的发展过程中,128种远远不能满足增加的需求(各种国家语言等),所以引入了Unicode,但Unicode只规定了符号的二进制代码,并没有规定存储方式。因此引入了UTF-8,UTF-8是一种 Unicode 的实现方式。对于英语字母,UTF-8 编码和 ASCII 码是相同的。

python3 字符串默认的是 Unicode 编码

对于单个字符使用如下:

>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'

对于一个长的字符串使用如下:

import numpy as np

str = 'hello world'
ascii = np.fromstring(str, dtype=np.uint8)
print(ascii)

输出为 [104 101 108 108 111 32 119 111 114 108 100]