通过未初始化全局变量,研究BSS段和COMMON段的不同
程序员文章站
2022-05-23 22:00:55
本文的copyleft归gfree.wind@gmail.com所有,使用gpl发布,可以*拷贝,转载。但转载请保持文档的完整性,注明原作者及原链接,严禁用于任何商业用途。
作...
本文的copyleft归gfree.wind@gmail.com所有,使用gpl发布,可以*拷贝,转载。但转载请保持文档的完整性,注明原作者及原链接,严禁用于任何商业用途。
作者:gfree.wind@gmail.com
博客:linuxfocus.blog.chinaunix.net
最近正在重温《程序员的自我修养》一书,由于水平比以前有所提升,所以的收获也不一样。
下面针对该书3.3.3节bss段的内容进行更细节的探讨——该节内容不在本文中重复说明了,只说一下结论。对于全局变量来说,如果初始化了不为0的值,那么该全局变量则被保存在data段,如果初始化的值为0,那么将其保存在bss段,如果没有初始化,则将其保存在common段,等到链接时再将其放入到bss段。关于第三点不同编译器行为会不同,有的编译器会把没有初始化的全局变量直接放到bss段。
关于上面这个结论,我就不重复进行探讨了,下面探讨一下更细节点的问题。从上面的内容上看,尽管未初始化的全局变量有可能在编译阶段被保存在common段,但是最终还是会放到bss段。那么我们是否可以将未初始化的全局变量与初始为0的全局变量等同起来呢?
请看下面的代码:
文件test1.c:
#include <stdio.h>
int init = 0;
void init1()
{
if (0 == init) {
init = 1;
printf("init1\n");
}
}
编译gcc -g -c test1.c
文件test2.c:
#include <stdio.h>
int init = 1;
void init2()
{
if (init) {
init = 0;
printf("init2\n");
}
}
编译gcc -g -c test2.c
文件main.c
void init1();
void init2();
int main()
{
init1();
init2();
return 0;
}
编译gcc -g -o test main.c test1.o test2.o
这时会报错
test2.o:(.data+0x0): multiple definition of `init'
test1.o:/root/work/test/test1.c:4: first defined here
collect2: ld returned 1 exit status
这个报错大家都可以接受吧?ok,那么现在我们做一个小小的改动,将文件test1.c中的int init = 0改为int init,对于test1.c来说,这个改动不影响其逻辑,因为init如果未初始化,其值也应该是0。
当前的test1.c
#include <stdio.h>
int init;
void init1()
{
if (0 == init) {
init = 1;
printf("init1\n");
}
}
编译gcc -g -c test1.c
gcc -g -wall -o test main.c test1.o test2.o
这次即使使用-wall打开所以warning,也没有任何警告和错误,已经生成了输出文件test。
执行test
[root@lnx99 test]#./test
init2
好,下面探讨一下为什么是这样。第一种情况,当test1.c中的init被初始化为0时,尽管init被放置在bss段,但是它是一个强符号。而test2.c中,定义了init为1,也是一个强符号,所以引发了错误。第二种情况,当test1.c中的init不进行初始化,尽管其值仍然为0,但是其被保存在common段,为一个弱符号。当test2.c中定义了init为1一个强符号,那么在链接的过程中,gcc会用这个强符号覆盖掉弱符号,并不会引起链接冲突错误。但是在运行阶段,进入init1时,这个init的值却并不是其所期望的值,因此导致没有打印init1。
我想关于bss与common段的这点不同,应该讲得比较清楚了。从这个区别中,我们需要注意,当定义全局变量时,有两点需要注意:一,如果只有本文件使用,那么需要添加上static;二,即使不能使用static,那么一定要为该全局变量定义初值,即使这个值就是0。这样可以保证该变量为强符号,当名字冲突时,可以发现,而不是被未知的值覆盖。三嘛,最好能够避免全局变量,或者定义一个独一无二的名字。
再多说一点,在编译阶段,还可以通过-fno-common选项来禁止将未初始化的全局变量放入到common段。
同样的文件,看下面的编译链接过程:
[root@lnx99 test]#gcc -g -fno-common -c test1.c
[root@lnx99 test]#gcc -g -fno-common -c test2.c
[root@lnx99 test]#gcc -g -fno-common -o test main.c test1.o test2.o
test2.o:(.data+0x0): multiple definition of `init'
test1.o:/root/work/test/test1.c:6: first defined here
collect2: ld returned 1 exit status
作者:gfree.wind@gmail.com
博客:linuxfocus.blog.chinaunix.net
最近正在重温《程序员的自我修养》一书,由于水平比以前有所提升,所以的收获也不一样。
下面针对该书3.3.3节bss段的内容进行更细节的探讨——该节内容不在本文中重复说明了,只说一下结论。对于全局变量来说,如果初始化了不为0的值,那么该全局变量则被保存在data段,如果初始化的值为0,那么将其保存在bss段,如果没有初始化,则将其保存在common段,等到链接时再将其放入到bss段。关于第三点不同编译器行为会不同,有的编译器会把没有初始化的全局变量直接放到bss段。
关于上面这个结论,我就不重复进行探讨了,下面探讨一下更细节点的问题。从上面的内容上看,尽管未初始化的全局变量有可能在编译阶段被保存在common段,但是最终还是会放到bss段。那么我们是否可以将未初始化的全局变量与初始为0的全局变量等同起来呢?
请看下面的代码:
文件test1.c:
#include <stdio.h>
int init = 0;
void init1()
{
if (0 == init) {
init = 1;
printf("init1\n");
}
}
编译gcc -g -c test1.c
文件test2.c:
#include <stdio.h>
int init = 1;
void init2()
{
if (init) {
init = 0;
printf("init2\n");
}
}
编译gcc -g -c test2.c
文件main.c
void init1();
void init2();
int main()
{
init1();
init2();
return 0;
}
编译gcc -g -o test main.c test1.o test2.o
这时会报错
test2.o:(.data+0x0): multiple definition of `init'
test1.o:/root/work/test/test1.c:4: first defined here
collect2: ld returned 1 exit status
这个报错大家都可以接受吧?ok,那么现在我们做一个小小的改动,将文件test1.c中的int init = 0改为int init,对于test1.c来说,这个改动不影响其逻辑,因为init如果未初始化,其值也应该是0。
当前的test1.c
#include <stdio.h>
int init;
void init1()
{
if (0 == init) {
init = 1;
printf("init1\n");
}
}
编译gcc -g -c test1.c
gcc -g -wall -o test main.c test1.o test2.o
这次即使使用-wall打开所以warning,也没有任何警告和错误,已经生成了输出文件test。
执行test
[root@lnx99 test]#./test
init2
好,下面探讨一下为什么是这样。第一种情况,当test1.c中的init被初始化为0时,尽管init被放置在bss段,但是它是一个强符号。而test2.c中,定义了init为1,也是一个强符号,所以引发了错误。第二种情况,当test1.c中的init不进行初始化,尽管其值仍然为0,但是其被保存在common段,为一个弱符号。当test2.c中定义了init为1一个强符号,那么在链接的过程中,gcc会用这个强符号覆盖掉弱符号,并不会引起链接冲突错误。但是在运行阶段,进入init1时,这个init的值却并不是其所期望的值,因此导致没有打印init1。
我想关于bss与common段的这点不同,应该讲得比较清楚了。从这个区别中,我们需要注意,当定义全局变量时,有两点需要注意:一,如果只有本文件使用,那么需要添加上static;二,即使不能使用static,那么一定要为该全局变量定义初值,即使这个值就是0。这样可以保证该变量为强符号,当名字冲突时,可以发现,而不是被未知的值覆盖。三嘛,最好能够避免全局变量,或者定义一个独一无二的名字。
再多说一点,在编译阶段,还可以通过-fno-common选项来禁止将未初始化的全局变量放入到common段。
同样的文件,看下面的编译链接过程:
[root@lnx99 test]#gcc -g -fno-common -c test1.c
[root@lnx99 test]#gcc -g -fno-common -c test2.c
[root@lnx99 test]#gcc -g -fno-common -o test main.c test1.o test2.o
test2.o:(.data+0x0): multiple definition of `init'
test1.o:/root/work/test/test1.c:6: first defined here
collect2: ld returned 1 exit status