欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

C++中的new和delete的实现原理

程序员文章站 2022-03-27 09:46:57
...

  1. new与operator new

  C++中有很多语法让人难以理解,如:new operator(操作符,下同)和operator new之间差异,确切的说,应该是new与operator new 的区别。

  1.1 new operator

  如下代码:

  string *ps=new string("memory management");

  这里所使用的new就是所谓new operator,是由C++语言内建的,就像sizeof那样,不能改变意义,总是做相同的事情。

  这个动作的含义分为两方面:

  第一,它分配足够的内存,用来放置某类型的对象。对于上例而言,它分配足够放置一个string 对象内存。第二,它调用一个构造函数,为刚才分配的内存中的那个对象设定初始值。

  new operator总是做这两件事,无论如何你是不能改变其行为。

  1.2 operator new

  能够改变的是用来容纳对象的那块内存的分配行为,new operator调用某个函数,执行必要的内存分配动作,你可以重写或者重载那个函数,改变其行为。这个函数名称就叫operator new 。

  函数 operator new 通常声明如下:

  void * operator new (size_t size);

  其返回类型void*。即返回一个指针,指向一块原始的、未设置初始值的内存。

  函数中的size_t参数表示需要分配多少内存,你可以将operator new 重载,加上额外的参数,但第一个参数类型必须总是size_t。

  或者你从来没有直接用过operator new ,但是你可以像调用任何其他函数一样地调用它。

  void* rawMemory=operator new(sizeof(string));

  这里的operator new 将返回指针,它指向一块足够容纳string对象的内存。

  和malloc一样,operator new 的唯一任务就是分配内存,它不知道什么是构造函数,它只负责分配内存。

  取得operator new 返回的内存并将之转为一个对象,是new operator的责任。

  1.3 当编译器看到这个句子:

  string *ps=new string("memory management");

  它必须产生一些代码,或多或少会反映如下行为:

  1) void* memory=operator new(sizeof(string)); //取得原始内存,用于放置一个string对象2) call string::string("memory management") on *memory;//将内存中对象初始化3) string *ps=static_cast(memory); //让ps指向新完成的对象

  注意第二步,调用一个构造函数。身为程序员没有权利绕过new operator像这么使用构造函数,但是编译器却是这么干的。

  这就是为什么如果你想要做出一个heap-based object,一定要用new operator的原因。

  也就是说new 出来的东西都放在heap里面,而无法直接调用“对象初始化所必须的构造函数”。

  2. placement new

  2.1 有时候你真的会想直接调用一个构造函数,针对一个已经存在的对象调用其构造函数,并无意义,因为构造函数用来对象初始化,而对象只能初始化一次。但是你偶尔会有一些分配好的原始内存,你需要在上面构建对象,有一个特殊的地方 operator new 称为placement new,允许这么做。

  例如:

  class Widget { public: Widget(int widgetSize); ...... };

  Widget* constructWidgetInBuffer(void *buffer,int size) { return new (buffer) Widget(size); }

  此函数返回指针,指向一个Widget object,它被构造于传递给此函数的一块内存缓存区上。当程序运行到共享内存或者内存I/O映射。这类函数可能是有用的,因为在那样运用中,对象必须置于特定的地址,或者置于特殊函数分配出来的内存上。

  2.2 函数内部

  Widget* constructWidgetInBuffer 只有一个表达式new (buffer) Widget(size),

  有点奇怪,其实不足为奇,这是new operator的用法之一,指定一个额外的自变量(buffer)作为new operator "隐式调用operator new "。于是,被调用的operator new 除了接受"一定要有size_t自变量"之外,还接受了一个void* 参数,指向一块内存,准备用来接受构造好的对象。这样的operator new 就是所谓的placement new :

  void * operator new(size_t size,void* location)

  {

  return location;

  }

  operator new 的目的是要为对象找到一块内存,然后返回一个指针指向它,在placement new 的情况下,调用者已经知道指向内存的指针了,因为调用者知道对象应该放在哪里。因此placement new 唯一需要做的就是将它获得的指针再返回。

  至于没有用到(但一定得有)的size_t参数,之所以不赋予名称,为的是避免"编译器某物未被使用"的警告。

  另外注意:placement new 是C++标准程序库的一部分,要使用placement new 得用#include,旧式编译器用 #include

  回头想想placement new ,我们便能了解new operator和operator new之间的关系。

  两个术语表面上令人迷惑,但其实很好理解:

  1)如果你希望将对象产生于heap,就是得new operator,它不但分配内存而为该对象调用一个构造函数。2)如果你只是打算分配内存,请用operator new,就没有构造QQ靓号卖号平台函数被调用。3)如果你打算在heap object产生自己决定的内存分配方式,请写一个自己的operator new。并使用new operator,它将会自动调用你所写的operator new。4)如果你打算在已经分配(并拥有指针)的内存构造对象,请使用placement new 。 3. delete 与内存释放

  为了避免resource leaks,每一个动态分配行为都必须匹配一个相应的释放动作。

  3.1 函数 operator delete对于内建的delete operator(操作符)就好像 operator new 对于new operator一样。

  string *ps;

  ...

  delete ps; //使用delete operator.

  内存释放动作是由operator delete执行的,通常声明如下:

  void operator delete(void* memoryToBeDeallocated);

  因此 delete ps;会造成编译器代码如下:

  1)ps->~string();//调用析构函数2)operator delete(ps);//释放对象所占用的内存3.2 这里提示我们,如果只打算处理原始的、未设初值的内存,应该完全回避 new operator和delete operator。改为调用operator new取得内存并以operator delete归还系统。

  例如:

  void* buffer=operator new (50*sizeof(char));//分配内存,放置50个char,没有调用构造函数

  ...

  operator delete(buffer); //释放内存,而没有直接调用析构函数。

  这组行为类似malloc和free。

  3.3 placement new

  如果使用了placement new ,在某块内存中产生对象,你应该避免那块内存使用delete operator(操作符)。

  因为delete operator会调用operator delete来释放内存,但是该内存所含的对象最初并不是由operator new 分配来的。placement new只是返回它接收的指针而已,谁知道那个指针从哪里来呢?

  所以为了抵消该对象的构造函数的影响,使用placement new 时应该直接调用该对象的析构函数。

  例如:

  void * mallocShared(size_t size);//申请分配内存

  void freeShared(void * momery);//释放内存

  void* sharedMemory=mallocShared(sizeof(Widget));

  Widget *pw=constructWidgetBuffer(sharedMemory,10);//使用前面Widget类的placement new

  ...

  delete pw;//无定义,因为sharedMemory来自mallocShared,不是来自new。

  pw->~Widget();//OK,析构函数pw所指Widget对象,但并未释放Widget所占用内存。

  freeShared(pw);//OK,释放pw所指的内存,不调用任何析构函数。

  如上述所示,如果交给placement new的原始内存(raw memory)本身是动态分配而得的,那么最终得释放那块内存,以避免memory leak。

  4. 动态分配数组(Arrays)

  前面所做的都是基于单一对象上的,如果是一组对象呢?

  string *ps=new string[10];//分配一个对象数组

  4.1 这里的new 与前面的new 行为类似,但略有不同,这里不能再operator new分配内存,而是以operator new[]负责分配。

  和operator new 一样,operator new[]也可以被重载。

  注:operator new[]是相当晚的时候才加入C++的一个特性,所以你的编译器不一定能支持它。如果是这样,全局的operator new 会被用来为每一个数组分配内存(不论数组中的对象是什么类型)。在这样的编译器下定制“数组内存分配行为”很困难,因为你得改写全局的operator new才行。默认情况下,全局版的operator new 负责程序中所有的动态内存分配,所以其行为的任何改变都可能带来全局的影响。

  另外,前面讲过,operator new 只允许size_t一个参数。所以你如果决定声明为自己的函数,你的程序便不兼容于任何做了相同决定的程序库。

  多方面考虑之下,如果编译器不支持operator new[],定制数组内存管理行为,不是一个明智的决定。

  4.2 数组的new 与单一对象的new所调用的构造函数不同,数组的new 必须针对数组中每一个对象调用一个构造函数。

  string *ps=new string[10];//调用operator new[]以分配足够容纳10个string对象的内存,然后针对每个元素调用string的默认构造函数。

  同样的,当使用了delete,它也会针对数组中每一个元素调用析构函数,然后再调用operator delete[]释放内存。

  如:delete []ps;//为数组中的每一个元素调用string 析构函数,然后再调用 operator delete[] 释放内存。 (先调用析构函数,再释放内存。)

  跟operator delete一样 operator delete[]也可以被重载。

  最后小结一下,new 和delete都是内建的操作符,语言本身所固定了,无法重新定制。但它所调用的内存分配/释放的函数,即operator new和operator delete可以被重载。