欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

Python struct(字节流,组包拆包实现)模块详解

程序员文章站 2022-05-02 08:42:02
...
看到struct这么英文单词,大家应该并不陌生,因为c/c++中就有struct,在那里struct叫做结构体。在Python中也使用struct,这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换,从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述,进而根据这个格式字符串转换成Python值。

我们知道python只定义了6种数据类型,字符串,整数,浮点数,列表,元组,字典。但是C语言中有些字节型的变量,在python中该如何实现呢?这点颇为重要,特别是要在网络上进行数据传输的话。

python提供了一个struct模块来提供转换。下面就介绍这个模块中的几个方法。

pack(fmt, v1, v2, ...) ------ 根据所给的fmt描述的格式将值v1,v2,...转换为一个字符串。

unpack(fmt, bytes) ------ 根据所给的fmt描述的格式将bytes反向解析出来,返回一个元组。

calcsize(fmt) ------ 根据所给的fmt描述的格式返回该结构的大小。

struct.pack():

struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, ...),参数fmt是格式字符串,关于格式字符串的相关信息下面有所介绍。v1, v2, ...表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):

>>> import struct

>>> a=20

>>> b=400

>>> str=struct.pack('ii',a,b) #转换成字节流,虽然还是字符串,但是可以在网络上传输

>>> print len(str) #ii 表示两个int

8 #可以看到长度为8个字节,正好是两个int型数据的长度

>>> print str

#二进制是乱码

>>> print repr(str)

'\x14\x00\x00\x00\x90\x01\x00\x00' #其中十六进制的 0x00000014, 0x00001009分别表示20和400

>>>

由此我们就可以任意的进行组包了,比如下面一个打包的例子,只介绍其中的pack

format = "!HH%ds" % len(data)

buffer = struct.pack(format,opcode,blocknumber,data)

我们要对一个数据进行打包,加上一些个包头,我们根据下面的格式符信息,知道H是unsigned short是2个字节,而s是char型。所以这个buffer就是2个字节的opcode,2个字节的blocknumber,和len长的char。

Python模块——struct(字节流,组包拆包实现)

struct.unpack():

我们接着上面的例子运行:

>>> a1,a2=struct.unpack('ii',str)

>>> print 'a1',a1

a1 20

>>> print 'a2=',a2

a2= 400

可以看到 “ii”以四个字节为分界,把8个字节的str分成了两个int型的整数。

struct.calcsize():用来计算特定格式的输出的大小,是几个字节,比如:

>>> struct.calcsize('HH4s')

8

>>> struct.calcsize('ii')

8

>>>

>>> format='!HH%ds' % len('hello python')

>>> struct.calcsize(format)

16

>>>