欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

定位new表达式与显式调用析构函数

程序员文章站 2022-03-10 11:44:01
C++的核心理念之一是RAII,Resource Acquisition Is Initialization,资源获取即初始化。资源有很多种,内存、互斥锁、文件、套接字等;RAII可以用来实现一种与作用域绑定的资源管理方法(如 );这些都不在本文的讨论范围之内。 内存是一种资源。从字面上来看,“资源 ......

c++的核心理念之一是raii,resource acquisition is initialization,资源获取即初始化。资源有很多种,内存、互斥锁、文件、套接字等;raii可以用来实现一种与作用域绑定的资源管理方法(如std::lock_guard);这些都不在本文的讨论范围之内。

内存是一种资源。从字面上来看,“资源获取”是指在栈或堆上开辟空间,“初始化”是指调用构造函数,“即”的意思是两者是绑定起来的。对应地,资源销毁即释放。这种机制保证了任何函数访问参数对象时不会访问到非法地址,除了构造和析构函数以外的任何函数的参数都不会是未初始化的。

然而,c++作为能够面向底层的语言,允许我们把内存获取与初始化分开来:std::mallocstd::free用于分配和释放内存,定位new表达式和析构函数的显式调用用于初始化和销毁对象。

malloc与free

std::malloc用于分配内存,std::free用于释放内存,两者都定义在<cstdlib>中:

void* malloc(std::size_t size);
void free(void* ptr);

比如,我想要分配一个int的动态内存,就应该给size填上sizeof(int),返回值就是指向那个int的指针。如果是数组,就给size乘上元素个数。注意在c++中,从void*t*的转换不能是隐式的。

要回收它,把指针传给free,不需要size

#include <iostream>
#include <cstdlib>

int main()
{
    auto p = static_cast<int*>(std::malloc(sizeof(int) * 10));
    p[0] = 1;
    p[1] = 2;
    std::cout << p[0] << ' ' << p[1] << std::endl;
    std::free(p);
}

如果std::malloc过程中发生了错误,比如内存不足,std::malloc会返回nullnullptr的前身。实际使用时都应该考虑这种情况。

std::malloc得到的内存必须用free释放。std::malloc/std::free的内存分配与new/delete不互通。

定位new表达式

std::malloc分配的内存是未经初始化的,对于int等内置类型可以直接使用,而类类型则未必,需要先初始化才能使用。

我们知道,类的非静态成员函数都有一个隐式的this指针作为参数,构造函数也不例外,在未初始化的内存上构造对象,就是把这块内存的指针作为this传入构造函数。不幸的是,没有显式调用构造函数这种语法:

auto ptr = static_cast<a*>(std::malloc(sizeof(a)));
ptr->a("hello"); // error

(在msvc中,ptr->a::a("hello");是合法的,但这是非标准的。)

我们需要定位new,它定义在<new>中,需要#include以后才能使用:

void* operator new(std::size_t, void*);

new运算符是可以重载的,new运算符的功能是为new表达式中的构造函数提供this指针。但是定位new不行,它总是忠实地返回它的第二个参数。

定位new表达式有以下形式:

new (ptr) type;
new (ptr) type(args);
new (ptr) type[size];
new (ptr) type[size]{list};

ptr为要当作this的指针,type为要构造的类型,args为可能为空的参数列表,size为数组大小(可以动态),list为数组元素列表。

利用定位new,把ptr作为this的构造函数可以这样调用:

#include <iostream>
#include <cstdlib>
#include <string>
#include <utility>

class a
{
public:
    a(std::string s) : string(std::move(s))
    {
        std::cout << "a::a(std::string)" << std::endl;
    }
    std::string& get()
    {
        return string;
    }
private:
    std::string string;
};

int main()
{
    auto ptr = static_cast<a*>(std::malloc(sizeof(a)));
//  std::cout << ptr->get() << std::endl; // disaster
//  ptr->a("hello");                      // error
    new (ptr) a("hello");
    std::cout << ptr->get() << std::endl;
//  delete ptr;                           // disaster
    // what's next?
}

不要因为ptr简单就不加括号,括号不是为了什么运算符优先级,而是定位new表达式的一部分。

刚才不是说std::mallocnew不互通吗?怎么在std::malloc来的ptr上用定位new了呢?因为定位new根本不插手内存分配,和std::malloc是两回事。

定位new不止可以用于std::malloc来的动态内存,甚至可以是局部变量:

char buffer[sizeof(a)];
auto ptr = new (buffer) a("hello");
std::cout << ptr->get() << std::endl;

与常规的new一样,定位new表达式也返回一个指针,就是type*类型的ptr

显式调用析构函数

上面通过std::malloc得到的ptr,为什么不能直接std::free呢?因为std::string里面的资源还没释放,正确的做法是调用a的析构函数。

不能对一个对象调用构造函数,那么析构函数呢?答案是肯定的。只是~在形式上有点怪,尤其是当你把模板参数t换成int后得到ptr->~int()时,后者直接写是不合法的。

所以对于上面的ptr,要这样才能释放所有资源:

ptr->~a();
std::free(ptr);

显式调用析构函数,就像在帮编译器做事情一样。编译器会不会领情呢?写个代码测试一下吧:

#include <iostream>
#include <string>
#include <utility>

class a
{
public:
    a(std::string s) : string(std::move(s))
    {
        std::cout << "a::a(std::string)" << std::endl;
    }
    std::string& get()
    {
        std::cout << "a::get()" << std::endl;
        return string;
    }
    ~a()
    {
        std::cout << "a::~a()" << std::endl;
    }
private:
    std::string string;
};

int main()
{
    {
        a a("");
        a.~a();
    }
    std::cout << "i'm ok" << std::endl;
}

程序输出:

a::a(std::string)
a::~a()
a::~a()
i'm ok

看来编译器并不领情,即使我们调用了析构函数,变量离开作用域时还会再调用一次。尽管在msvc和gcc中,i'm ok都成功输出了,std::string都挺住了错误的析构,但是这个程序的行为仍然是未定义的。

因此,定位new语句与析构函数的显式调用必须配对。