欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

C当中关于sizeof(struct)和sizeof(union)计算

程序员文章站 2024-02-26 16:01:40
...

一般32位机子上各个数据类型所占的存储空间如下:

char:8位 

short:16位

int:32位

long:32位

float:32位

double:64位

一、接下来先来看struct,结构体

请牢记以下3条原则:(在没有#pragma pack宏的情况下)

1、数据成员对齐规则:结构体(struct)的数据成员,第一个数据成员放在offset为0的地方,之后的每个数据成员存储的起始位置要从该成员大小的整数倍开始(比如int在32位机子上为4字节,所以要从4的整数倍地址开始存储)。

2、结构体作为成员:如果一个结构体里同时包含结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(如struct a里有struct b,b里有char,int ,double等元素,那么b应该从8(即double类型的大小)的整数倍开始存储)。

3、结构体的总大小:即sizeof的结果。在按之前的对齐原则计算出来的大小的基础上,必须还得是其内部最大成员的整数倍,不足的要补齐(如struct里最大为double,现在计算得到的已经是11,则总大小为16)。

具体例子:

  1. typedef struct bb  
  2. {  
  3.     int id;             //[0]….[3]      表示4字节  
  4.     double weight;      //[8]…..[15]      原则1  
  5.     float height;      //[16]..[19],总长要为8的整数倍,仅对齐之后总长为[0]~[19]为20,补齐[20]…[23]     原则3  
  6. }BB;  
typedef struct bb
{
    int id;             //[0]....[3]      表示4字节
    double weight;      //[8].....[15]      原则1
    float height;      //[16]..[19],总长要为8的整数倍,仅对齐之后总长为[0]~[19]为20,补齐[20]...[23]     原则3
}BB;
  1. typedef struct aa    
  2. {     
  3.     int  id;         //[0]…[3]          原则1    
  4.     double score;     //[8]….[15]        
  5.     short grade;    //[16],[17]            
  6.     BB b;             //[24]……[47]       原则2(因为BB内部最大成员为double,即8的整数倍开始存储)    
  7.     char name[2]; //[48][49]  
  8. }AA;   
typedef struct aa  
{   
    int  id;         //[0]...[3]          原则1  
    double score;     //[8]....[15]      
    short grade;    //[16],[17]          
    BB b;             //[24]......[47]       原则2(因为BB内部最大成员为double,即8的整数倍开始存储)  
    char name[2]; //[48][49]
}AA; 

  1. int main()  
  2. {  
  3.     cout<<sizeof(AA)<<“ ”<<sizeof(BB)<<endl;  
  4.     return 0;  
  5. }  
int main()
{
    cout<<sizeof(AA)<<" "<<sizeof(BB)<<endl;
    return 0;
}
输出结果为56 24

以上结果是在没有#pragma pack(n)宏的情况下,现在来讲讲关于#pragma pack(n)。

编译器中提供了#pragma pack(n)来设定变量以n字节对齐方式。//n为1、2、4、8、16…

n字节对齐就是说变量存放的起始地址的偏移量有两种情况:第一、如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式,即该变量所占用字节数的整数倍;第二、如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式。

结构的总大小也有个约束条件,分下面两种情况:如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数;否则必须为n的倍数。

所以在上面的代码前加一句#pragma pack(1),

则代码输出为bb:(0~3)+(4~11)+(12~15)=16;aa:(0~1)+(2~5)+(6~13)+(14~15)+(16~31)=32,也就是说,#pragma pack(1)就是没有对齐规则。

再考虑#pragma pack(4),bb:(0~3)+(4~11)+(12~15)=16;aa:(0~1)+(4~7)+(8~15)+(16~17)+(20~35)=36

二、union共用体(联合)

共用体表示几个变量共用一个内存位置,在不同的时间保存不同的数据类型和不同长度的变量。在union中,所有的共用体成员共用一个空间,并且同一时间只能储存其中一个成员变量的值。当一个共用体被声明时, 编译程序自动地产生一个变量, 其长度为联合中元类型(如数组,取其类型的数据长度)最大的变量长度的整数倍,且要大于等于其最大成员所占的存储空间。
  1. union foo  
  2. {  
  3. char s[10];  
  4. int i;  
  5. }  
union foo
{
char s[10];
int i;
}
在这个union中,foo的内存空间的长度为12,是int型的3倍,而并不是数组的长度10。若把int改为double,则foo的内存空间为16,是double型的两倍。
  1. union   mm{    
  2.   char   a;//元长度1        1  
  3.   int   b[5];//元长度4     20  
  4.   double   c;//元长度8     8  
  5.   int   d[3];              12  
  6.   };    
union   mm{  
  char   a;//元长度1        1
  int   b[5];//元长度4     20
  double   c;//元长度8     8
  int   d[3];              12
  };  
所以sizeof(mm)=8*3=24;
当在共用体中包含结构体时,如下:
  1. struct inner  
  2. {  
  3.    char      c1;  
  4.    double   d;  
  5.    char     c2;  
  6.   };  
  7.   
  8. union data4  
  9. {  
  10.      struct   inner t1;  
  11.       int           i;  
  12.       char        c;  
  13.     };  
struct inner
{
   char      c1;
   double   d;
   char     c2;
  };

union data4
{
     struct   inner t1;
      int           i;
      char        c;
    };
由于data4共用体中有一个inner结构体,所以最大的基本数据类型为double,因此以8字节对齐。共用体的存储长度取决于t1,而t1长度为24,因此sizeof(uniondata4)的值为24.

当在结构体中包含共用体时,共用体在结构体里的对齐地址为共用体本身内部所对齐位数,如下:
  1. typedef union{  
  2.     long i;  
  3.     int k[5];  
  4.     char c;  
  5. }DATE;  
  6. struct data{  
  7.     int cat;  
  8.     char cc;  
  9.     DATE cow;  
  10.     char a[6];  
  11. };  
typedef union{
    long i;
    int k[5];
    char c;
}DATE;
struct data{
    int cat;
    char cc;
    DATE cow;
    char a[6];
};
sizeof(DATE)=20, 而在结构体中中是4+1+3(补齐4对齐)+20+6+2(补齐4对齐)=36;


三、两者的区别

1. 共用体和结构体都是由多个不同的数据类型成员组成, 但在任何同一时刻, 共用体只存放了一个被选中的成员, 而结构体的所有成员都存在。
2. 对于共用体的不同成员赋值, 将会对其它成员重写, 原来成员的值就不存在了, 而对于结构体的不同成员赋值是互不影响的。


相关标签: c语言