C++ inline内联函数详解
函数是一个可以重复使用的代码块,CPU 会一条一条地挨着执行其中的代码。CPU 在执行主调函数代码时如果遇到了被调函数,主调函数就会暂停,CPU 转而执行被调函数的代码;被调函数执行完毕后再返回到主调函数,主调函数根据刚才的状态继续往下执行。
一个 C/C++ 程序的执行过程可以认为是多个函数之间的相互调用过程,它们形成了一个或简单或复杂的调用链条,这个链条的起点是 main(),终点也是 main()。当 main() 调用完了所有的函数,它会返回一个值(例如return 0;
)来结束自己的生命,从而结束整个程序。
函数调用是有时间和空间开销的。程序在执行一个函数之前需要做一些准备工作,要将实参、局部变量、返回地址以及若干寄存器都压入栈中,然后才能执行函数体中的代码;函数体中的代码执行完毕后还要清理现场,将之前压入栈中的数据都出栈,才能接着执行函数调用位置以后的代码。关于函数调用的细节,我们已经在《C语言内存精讲》一章中的《一个函数在栈上到底是怎样的》《用一个实例来深入剖析函数进栈出栈的过程》两节中讲到。
如果函数体代码比较多,需要较长的执行时间,那么函数调用机制占用的时间可以忽略;如果函数只有一两条语句,那么大部分的时间都会花费在函数调用机制上,这种时间开销就就不容忽视。
为了消除函数调用的时空开销,C++ 提供一种提高效率的方法,即在编译时将函数调用处用函数体替换,类似于C语言中的宏展开。这种在函数调用处直接嵌入函数体的函数称为内联函数(Inline Function),又称内嵌函数或者内置函数。
指定内联函数的方法很简单,只需要在函数定义处增加 inline 关键字。请看下面的例子:
#include <iostream>using namespace std;//内联函数,交换两个数的值inline void swap(int *a, int *b){ int temp; temp = *a; *a = *b; *b = temp;}int main(){ int m, n; cin>>m>>n; cout<<m<<", "<<n<<endl; swap(&m, &n); cout<<m<<", "<<n<<endl; return 0;}
运行结果:
45 99↙
45, 99
99, 45
注意,要在函数定义处添加 inline 关键字,在函数声明处添加 inline 关键字虽然没有错,但这种做法是无效的,编译器会忽略函数声明处的 inline 关键字。
当编译器遇到函数调用swap(&m, &n)
时,会用 swap() 函数的代码替换swap(&m, &n)
,同时用实参代替形参。这样,程序第 16 行就被置换成:
int temp;temp = *(&m);*(&m) = *(&n);*(&n) = temp;
编译器可能会将 (&m)、(&n) 分别优化为 m、n。
当函数比较复杂时,函数调用的时空开销可以忽略,大部分的 CPU 时间都会花费在执行函数体代码上,所以我们一般是将非常短小的函数声明为内联函数。
由于内联函数比较短小,我们通常的做法是省略函数原型,将整个函数定义(包括函数头和函数体)放在本应该提供函数原型的地方。下面的例子是一个反面教材,这样的写法是不被推荐的:
#include <iostream>using namespace std;//声明内联函数void swap1(int *a, int *b); //也可以添加inline,但编译器会忽略int main(){ int m, n; cin>>m>>n; cout<<m<<", "<<n<<endl; swap1(&m, &n); cout<<m<<", "<<n<<endl; return 0;}//定义内联函数inline void swap1(int *a, int *b){ int temp; temp = *a; *a = *b; *b = temp;}
使用内联函数的缺点也是非常明显的,编译后的程序会存在多份相同的函数拷贝,如果被声明为内联函数的函数体非常大,那么编译后的程序体积也将会变得很大,所以再次强调,一般只将那些短小的、频繁调用的函数声明为内联函数。
内联函数看起来简单,但是有很多细节要引起重视,我们将在后续两节《C++内联函数也可以用来代替宏》《如何规范地使用C++内联函数》对内联函数的本质以及使用规范进行深入的讲解。
最后需要说明的是,对函数作 inline 声明只是程序员对编译器提出的一个建议,而不是强制性的,并非一经指定为 inline 编译器就必须这样做。编译器有自己的判断能力,它会根据具体情况决定是否这样做。
C++内联函数也可以用来代替宏
我们在《C语言入门教程》中讲到,宏是可以带参数的,它在形式上和函数非常相似。不过不像函数,宏仅仅是字符串替换,不是按值传递,所以在编写宏时要特别注意,一不小心可能就会踩坑。
使用宏的一个经典例子是求一个数的平方,如下所示:
#include <iostream>
using namespace std;
#define SQ(y) y*y
int main(){
int n, sq;
cin>>n;
sq = SQ(n);
cout<<sq<<endl;
return 0;
}
运行结果:
9↙
81
从表面上看这个宏定义是正确的,但当我们将宏调用SQ(n)
换成SQ(n+1)
后,就会出现意想不到的状况:
#include <iostream>
using namespace std;
#define SQ(y) y*y
int main(){
int n, sq;
cin>>n;
sq = SQ(n+1);
cout<<sq<<endl;
return 0;
}
运行结果:
9↙
19
我们期望的结果是 100,但这里却是 19,两者大相径庭。这是因为,宏展开仅仅是字符串的替换,不会进行任何计算或传值,上面的sq = SQ(n+1);
在宏展开后会变为sq = n+1*n+1;
,这显然是没有道理的。
如果希望得到正确的结果,应该将宏定义改为如下的形式:
#define SQ(y) (y)*(y)
这样宏调用sq = SQ(n+1);
就会展开为sq = (n+1)*(n+1);
,得到的结果就是 100。
如果你认为这样就万事大吉了,那下面的结果会让你觉得考虑不周:
#include <iostream>
using namespace std;
#define SQ(y) (y)*(y)
int main(){
int n, sq;
cin>>n;
sq = 200 / SQ(n+1);
cout<<sq<<endl;
return 0;
}
运行结果:
9↙
200
之所以会出现这么奇怪的结果,是因为宏调用sq = 200 / SQ(n+1);
会被展开为sq = 200 / (n+1) * (n+1);
,当 n 被赋值 9 后,相当于sq = 200 / 10 * 10
,结果显然是 200。
要想得到正确的结果,还应该对宏加以限制,在两边增加( )
,如下所示:
#define SQ(y) ( (y)*(y) )
这样宏调用sq = 200 / SQ(n+1);
就会展开为sq = 200 / ( (n+1) * (n+1) );
,得到的结果就是 2。
说了这么多,我最终想强调的是,宏定义是一项“细思极密”的工作,一不小心就会踩坑,而且不一定在编译和运行时发现,给程序埋下隐患。
如果我们将宏替换为内联函数,情况就没有那么复杂了,程序员就会游刃有余,请看下面的代码:
#include <iostream>
using namespace std;
inline int SQ(int y){ return y*y; }
int main(){
int n, sq;
cin>>n;
//SQ(n)
sq = SQ(n);
cout<<sq<<endl;
//SQ(n+1)
sq = SQ(n+1);
cout<<sq<<endl;
//200 / SQ(n+1)
sq = 200 / SQ(n+1);
cout<<sq<<endl;
return 0;
}
运行结果:
9↙
81
100
2
看,一切问题迎刃而解!发生函数调用时,编译器会先对实参进行计算,再将计算的结果传递给形参,并且函数执行完毕后会得到一个值,而不是得到一个表达式,这和简单的字符串替换相比省去了很多麻烦,所以在编写C++代码时我推荐使用内联函数来替换带参数的宏。
和宏一样,内联函数可以定义在头文件中(不用加 static 关键字),并且头文件被多次#include
后也不会引发重复定义错误。这一点和非内联函数不同,非内联函数是禁止定义在头文件中的,它所在的头文件被多次#include
后会引发重复定义错误。
内联函数在编译时会将函数调用处用函数体替换,编译完成后函数就不存在了,所以在链接时不会引发重复定义错误。这一点和宏很像,宏在预处理时被展开,编译时就不存在了。从这个角度讲,内联函数更像是编译期间的宏。
如果读者不了解编译和链接的细节,请阅读《C语言头文件的编写》一章,我们进行了深入详细的说明。
综合本节和上节的内容,可以看到内联函数主要有两个作用,一是消除函数调用时的开销,二是取代带参数的宏。不过我更倾向于后者,取代带参数的宏更能凸显内联函数存在的意义。
如何规范地使用C++内联函数
inline 关键字可以只在函数定义处添加,也可以只在函数声明处添加,也可以同时添加;但是在函数声明处添加 inline 关键字是无效的,编译器会忽略函数声明处的 inline 关键字。也就是说,inline 是一种“用于实现的关键字”,而不是一种“用于声明的关键字”。
尽管大多数教科书中在函数声明和函数定义处都增加了 inline 关键字,但我认为 inline 关键字不应该出现在函数声明处。这个细节虽然不会影响函数的功能,但是体现了高质量 C++ 程序设计风格的一个基本原则:声明与定义不可混为一谈,用户没有必要、也不应该知道函数是否需要内联。
更为严格地说,内联函数不应该有声明,应该将函数定义放在本应该出现函数声明的地方,这是一种良好的编程风格。
在多文件编程中,我们通常将函数的定义放在源文件中,将函数的声明放在头文件中,希望调用函数时,引入对应的头文件即可,我们鼓励这种将函数定义和函数声明分开的做法。但这种做法不适用于内联函数,将内联函数的声明和定义分散到不同的文件中会出错,请看下面的例子。
main.cpp 代码:
#include <iostream>
using namespace std;
//内联函数声明
void func();
int main(){
func();
return 0;
}
module.cpp 代码:
#include <iostream>
using namespace std;
//内联函数定义
inline void func(){
cout<<"inline function"<<endl;
}
上面的代码能够正常编译,但在链接时会出错。func() 是内联函数,编译期间会用它来替换函数调用处,编译完成后函数就不存在了,链接器在将多个目标文件(.o
或.obj
文件)合并成一个可执行文件时找不到 func() 函数的定义,所以会产生链接错误。
如果你对编译和链接的过程不了解,请阅读《C语言头文件的编写》一章。
内联函数虽然叫做函数,在定义和声明的语法上也和普通函数一样,但它已经失去了函数的本质。函数是一段可以重复使用的代码,它位于虚拟地址空间中的代码区,也占用可执行文件的体积,而内联函数的代码在编译后就被消除了,不存在于虚拟地址空间中,没法重复使用。
如果你对虚拟地址空间或代码区的概念不了解,请阅读《C语言内存精讲》专题。
内联函数看起来简单,但是有很多细节需要注意,从代码重复利用的角度讲,内联函数已经不再是函数了。我认为将内联函数作为带参宏的替代方案更为靠谱,而不是真的当做函数使用。
在多文件编程时,我建议将内联函数的定义直接放在头文件中,并且禁用内联函数的声明(声明是多此一举)。