结构体对齐的规则详解及C++代码验证
基本概念
cpu一次能读取多少个字节的数据主要是看数据总线是多少位的,16位cpu一次能读取2个字节,32位cpu一次能读取4个字节,64位cpu一次能读取8个字节。并且不能跨内存区间访问,这句话的意思可以理解为,如果cpu是32位的话,那么可以将整个内存区间每4个字节分为一块(block),每次读取一个block的数据。
那么对于下面这个结构体:
struct st { char c; int i; };
如果不进行对齐操作,char 的地址范围0x00000000,int的地址范围为0x00000001----0x00000004,int分布在两个不同的block上,因此要读取int需要两次操作;如果进行4字节对齐,那么int的地址范围为0x00000004----0x00000007,处在一个block上,因此只需一次读取操作即可。缺点也显而易见,多占用了3个字节。这也是典型的一种空间换时间的方法吧。
结构体对齐的规则
结构体对齐需要满足以下三条规则,其中系统对齐模数在64位机器上默认为8字节,32位机器上默认为4字节。通过预处理指令#pargma pack(n)可以修改系统模数为n个字节。
1、以结构体第一个元素的地址为起始地址,亦即结构体的起始地址。由上可知,第一个元素的偏移量为0;
2、结构体元素对齐原则:结构体成员的对齐模数为类型大小与系统对齐模数的较小者;结构体成员的偏移量(填充)为对齐模数的整数倍。
3、结构体大小对齐原则:结构体的对齐模数为结构体最大元素与系统对齐模数的较小者;结构体的大小(填充)为结构体对齐模数的整数倍。
程序验证
测试环境为64位windows ,vs2019,定义结构体st1,包含3个元素char,int,double,定义系统对齐模数为4个字节。
#include <iostream> #pragma pack(4) using tsize = unsigned long long; using namespace std; struct st1 { char c; int i; double db; tsize ch_offset() { return tsize((tsize)&this->c - (tsize)this); } tsize int_offset() { return tsize((tsize)&this->i - (tsize)this); } tsize double_offset() { return tsize((tsize)&this->db - (tsize)this); } }; int main() { cout << "st1结构体大小" << sizeof(st1) << endl; cout << "char 偏移量=" << st1().ch_offset() << endl; cout << "int偏移量=" << st1().int_offset() << endl; cout << "double偏移量=" << st1().double_offset() << endl; return 0; }
首先我们按照对齐规则来进行分析。第一个元素为char,类型大小为1个字节,对齐模数min(1,4)=1,偏移量为0是对齐模数的整数倍,无需填充(从这里我们可以看到,第一个字节偏移量始终为0,是不需要填充的),下一个元素的偏移从1开始;第二个元素为int,类型大小4个字节,对齐模数为4个字节,不填充时偏移量为1,不是4的整数倍,因此这里需要填充3个字节,使得int的偏移量为4,且下一个元素偏移从8开始;第三个元素是double,类型大小为8个字节,对齐模数为4,偏移量从8开始,是4的整数倍,因此无需填充,占用8个字节,因此结构体的大小为16个字节。运行程序输出:
将系统对齐模数修改为1 【#pargma pack(1)】,这样的话,任何情况下都无需填充(不足一个字节的类型视为一个字节),结构体的大小即为结构体元素大小之和。运行程序输出:
将系统对齐模数修改为8 【#pargma pack(8)】,这样的话,任何情况下都无需填充(不足一个字节的类型视为一个字节),结构体的大小即为结构体元素大小之和。运行程序输出:
emmm,好像和系统对齐模数为4时没什么变化。那我们将int 和 double的顺序换一下呢?
#include <iostream> #pragma pack(8) using tsize = unsigned long long; using namespace std; struct st1 { char c; double db; int i; tsize ch_offset() { return tsize((tsize)&this->c - (tsize)this); } tsize int_offset() { return tsize((tsize)&this->i - (tsize)this); } tsize double_offset() { return tsize((tsize)&this->db - (tsize)this); } }; int main() { cout << "st1结构体大小" << sizeof(st1) << endl; cout << "char 偏移量=" << st1().ch_offset() << endl; cout << "double偏移量=" << st1().double_offset() << endl; cout << "int偏移量=" << st1().int_offset() << endl; return 0; }
顺序调了下,结构体就比原来大了8个字节!!!从中我们可以看出,将结构体元素从小到大排列,可以最大程度节省空间。
总结
本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注的更多内容!