欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

C++ vector类的模拟实现方法

程序员文章站 2022-03-23 14:38:19
vector和string虽然底层都是通过顺序表来实现的,但是他们利用顺序表的方式不同,string是指定好了类型,通过使用顺序表来存储并对数据进行操作,而vector是利用了c++中的泛型模板,可以...

vector和string虽然底层都是通过顺序表来实现的,但是他们利用顺序表的方式不同,string是指定好了类型,通过使用顺序表来存储并对数据进行操作,而vector是利用了c++中的泛型模板,可以存储任何类型的数据,并且在vector中,并没有什么有效字符和容量大小的说法,底层都是通过迭代器进行操作的,迭代器底层实现也就是指针,所以说,vector是利用指针对任何顺序表进行操作的。

C++ vector类的模拟实现方法

vector属性

  • _start用于指向第一个有效元素
  • _finish用于指向最后一个有效元素的下一个位置
  • _endofstorage用于指向已经开辟了的空间的最后一个位置的下一个位置vector的迭代器是原生态t*迭代器
template<class t>
class vector
{
public:
	typedef t* iterator;
	typedef const t* const_iterator;

private:
	iterator _start;
	iterator _finish;
	iterator _endofstorage;
};

构造函数

  • 无参默认构造函数,将所有属性都置空
  • 以n个val初始化的构造函数,先开辟n个空间,再将这些空间的值都置为val,并更新_finish和_endofstorage的位置
  • 通过迭代器传参初始化的构造函数,使用新的迭代器,通过尾插将数据插入到新的空间

使用新的迭代器的原因是使传入的迭代器可以是任意类型的,如果使用vector的迭代器,那么传入的迭代器的类型只能和vector的类型一样,这里拿string举例,创建一个char类型的vector,vector,但是传入的迭代器并不是char类型的,可以是字符数组的迭代器或者是string的迭代器。只要通过解引用是char类型就可以

//无参默认构造
	vector()
		:_start(nullptr)
		,_finish(nullptr)
		,_endofstorage(nullptr)
	{}

	//n个val的构造函数
	vector(int n, const t& val = t())
		:_start(new t[n])
		,_finish(_start +n)
		,_endofstorage(_finish)
	{
		for (int i = 0; i < n; ++i)
		{
			_start[i] = val;
		}
	}

	//通过迭代器产生的构造函数
	template<class inputiterator>
	vector(inputiterator first, inputiterator last)
		:_start(nullptr)
		, _finish(nullptr)
		, _endofstorage(nullptr)
	{
		while (first != last)
		{
			pushback(*first);
			++first;
		}
	}

运行结果在begin() 和end()实现中

size()和capacity()

指针相减得到的值就是这两个指针之间的元素个数

	size_t size() const
	{
		return _finish - _start;
	}

	size_t capacity() const
	{
		return _endofstorage - _start;
	}

C++ vector类的模拟实现方法

pushback()

  • 检查容量,如果_finish和_endofstorage指针相等,说明容量已经满了,需要开辟更大的空间
  • 在_finish位置插入新的数据
  • 更新_finish
void pushback(const t& val)
	{
		//检查容量
		if (_finish == _endofstorage)
		{
			size_t newc = _endofstorage == nullptr ? 1 : 2 * capacity();
			reserve(newc);
		}

		//插入数据
		*_finish = val;
		//更新finish
		++_finish
	}

运行结果在begin() 和end()实现中

reserve

  • 检查n的合理性,reserve只能扩大不能缩小空间
  • 保存有效元素的个数,用于后面更新_finish使用
  • 申请空间并将数据拷贝到新的空间中,释放旧的空
  • 更新3个成员变量,注意_finish不能更新为_finish+size(),原因是size()是通过两指针运算得出来的,此时的_fiinsh已经指向了释放的空间,再去使用会出错,所以这也是有第二步的原因

以下代码存在浅拷贝问题,文章末尾会给出正确深拷贝代码和详细解释

	void reserve(size_t n)
	{
		//reserve只能扩大空间不能缩小空间
		if (n > capacity())
		{
			//保存有效元素
			size_t sz = size();
			//申请空间
			t* tmp = new t[n];
			//将数据拷贝到新的空间
			if (_start != nullptr)
			{
				//拷贝有效元素
				memcpy(tmp, _start, sizeof(t) * size());
				delete[] _start;
			}
			//更新
			_start = tmp;
			_finish = _start + sz;
			_endofstorage = _start + n;
		}
	}

运行结果在begin() 和end()实现中

begin() 和end()

iterator begin()
	{
		return _start;
	}

	iterator end()
	{
		return _finish;
	}

	const_iterator begin() const
	{
		return _start;
	}

	const_iterator end() const
	{
		return _finish;
	}

C++ vector类的模拟实现方法

有了begin()和end就可以使用范围for

template<class t>
void printvectorfor(vector<t>& vec)
{
	for (auto& e : vec)
	{
		cout << e;
	}
	cout << endl;
}

C++ vector类的模拟实现方法

[]运算符重载

t& operator[](size_t pos)
	{
		assert(pos < size());
		return _start[pos];
	}

	const t& operator[](size_t pos) const
	{
		assert(pos < size());
		return _start[pos];
	}

C++ vector类的模拟实现方法

resize()

  • n <= size 直接更新_finish的位置即可
  • size < n <= capacity,从_finish开始补充元素,补充到_start+n的位置,然后执行第一步
  • n > capacity 增容,执行第二和第一步
void resize(size_t n, const t& val = t())
	{
		//3.n >= capacity
		if (n > capacity())
		{
			reserve(n);
		}
		//2.size < n <= capacity
		if (n > size())
		{
			while (_finish != _start + n)
			{
				*_finish = val;
				++_finish;
			}
		}
		//1.n<=size
		_finish = _start + n;
	}

C++ vector类的模拟实现方法

insert()

  • 检查插入的位置的有效性[_start, _finish)
  • 检查容量,由于增容会导致pos迭代器失效,所以我们可以先保存pos对于_start的偏移量offset,增容后,再将pos重新赋值pos=_start+offset
  • 移动元素,从后往前移动,最后将pos位置的元素置为val
  • 更新_finish
void insert(iterator pos, const t& val)
	{
		//检查位置有效性
		assert(pos >= _start || pos < _finish);
		//检查容量
		if (_finish == _endofstorage)
		{
			//增容会导致迭代器失效
			//保存pos和_start的偏移量
			size_t offset = pos - _start;
			size_t newc = _endofstorage == nullptr ? 1 : 2 * capacity();
			reserve(newc);
			//更新pos
			pos = _start + offset;
		}
		//移动元素
		iterator end = _finish;
		while (end != pos)
		{
			*end = *(end - 1);
			--end;
		}
		//插入
		*pos = val;
		//更新
		++_finish;
	}

C++ vector类的模拟实现方法

erase()

  • 检查位置有效性
  • 移动元素,从前向后移动
  • 更新_finish
iterator erase(iterator pos)
	{
		//检查位置有效性
		assert(pos >= _start || pos < _finish);
		//移动元素,从前往后
		iterator start = pos + 1;

		while (start != _finish)
		{
			*(start - 1) = *start;
			++start;
		}
		//更新
		--_finish;
	}

C++ vector类的模拟实现方法

void popback()

利用erase接口进行尾删

void popback()
	{
		if (size() > 0)
			erase(end() - 1);
	}

C++ vector类的模拟实现方法

析构函数

~vector()
	{
		if (_start)
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}
	}

算法库中的find

头文件<algorithm>

template <class inputiterator, class t>
   inputiterator find (inputiterator first, inputiterator last, const t& val)

参数内容(从迭代器的begin起到end中,找到val值,找到返回该值所在的迭代器,找不到返回end)

C++ vector类的模拟实现方法

reserve的深浅拷贝问题

当我门使用自定义类型时,使用浅拷贝是效率最高的,但是当我们使用自定义类型时,并且存在内存资源的利用,就必须时刻注意存在的深浅拷贝问题。来看以下代码测试

void test()
{
	vector<string> v;
	string str1 = "123";
	string str2 = "456";
	string str3 = "789";
	v.pushback(str1);
	v.pushback(str2);
	v.pushback(str3);
}

调试结果:

C++ vector类的模拟实现方法

当我们在插入第三个字符串时,就发生了内存异常的问题,我们来看看到底是什么问题。
第一次插入str1,没有问题

C++ vector类的模拟实现方法

第二次插入str2,插入之前我们会扩容,会创建2倍大的空间tmp,然后通过memcpy内存拷贝(浅拷贝)将内容拷贝到tmp中,此时就有两个指向指向一个资源(123),拷贝完后delete[]要删除原有空间,将123释放后,其实现在新的空间的第一个元素指向的是一个已经释放了的空间,但是问题并没有暴露出来,第二个元素的插入也没有问题

C++ vector类的模拟实现方法

第三次str3的插入,这次插入也会进行扩容,会先开辟一个2倍大的空间tmp,然后通过memcpy内存拷贝(浅拷贝)将内容拷贝到tmp中,此时有两个指针指向已经释放的资源(123),有两个指针指向资源(456),当拷贝完成后会释放旧的空间,当释放原指针指向的(456)时不会报错,原因和第二次插入原因一样。但是释放原有空的第一个指针时,就会发生内存报错异常,原因是资源(123)已经被释放了,如果再释放就属于二次释放,是不安全的。内存错误就报异常。

C++ vector类的模拟实现方法

所以我们在扩容的时候不应该只是单纯的浅拷贝,也就是使用memcpy来拷贝内容,我们应该要使用深拷贝。将memcpy改为for (size_t i = 0; i < sz; ++i){tmp[i] = _start[i];}
整体代码如下:

void reserve(size_t n)
	{
		//reserve只能扩大空间不能缩小空间
		if (n > capacity())
		{
			//保存有效元素
			size_t sz = size();
			//申请空间
			t* tmp = new t[n];
			//将数据拷贝到新的空间
			if (_start != nullptr)
			{
				//拷贝有效元素
				//memcpy(tmp, _start, sizeof(t) * size());
				//深拷贝
				for (size_t i = 0; i < sz; ++i)
				{
					//调用自定义类型的赋值运算符重载函数,完成深拷贝
					//前提是该重载函数也是深拷贝,string是stl库中,是被深拷贝处理过
					tmp[i] = _start[i];
				}
				delete[] _start;
			}
			//更新
			_start = tmp;
			_finish = _start + sz;
			_endofstorage = _start + n;
		}
	}

到此这篇关于c++ vector类的模拟实现方法的文章就介绍到这了,更多相关c++ vector类模拟内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!