高级排序算法实现与优化
本文用到的测试数据生成的代码和分析:
文章图片来源于 github,网速不佳的朋友。
顺便软广一下个人技术小站:。欢迎常来 ♪(^∇^*)
1. 谈谈高级排序
本文主要介绍高级排序算法中的归并排序和快速排序。他们有运用了分支思想,并且大多通过递归来实现。
对于归并排序,分为自上向底和自底向上排序。对于快速排序,有常见的二路快排和系统级常用的三路快速排序。
2. 归并排序
2.1 设计和分析
在算法思想上:归并排序是分治法,所以需要等分数组,并且逐个完成排序,然后再合并在一起。而因为等分,所以树结构是平衡的(快速排序就不一定,需要进一步优化)。
在空间使用上:归并排序需要开启辅助空间,所以,在算法效率上自然比不上快速排序。
2.2 自顶向下的归并
2.2.1 三处优化
第一处优化是关于选取中间索引值的问题。显然,使用(l + r) / 2
可能会造成溢出。
所以,此处应该是:int mid = l + (r - l) / 2;
。
同时,不能是 r + (l - r) / 2
。 比如: l = 0, r = 1 的时候,这条式子的结果和(l + r) / 2
不同。因为 c++的自动向下取整。
第二处优化是关于递归到底层的时候,比如被切分出来的数据长度小于 15,此时可以使用插入排序来优化。
第三处优化是当归并前,先判断前一部分数据的最后一个值和后一部分数据最后一个值的大小关系,再决定是否优化。
2.2.2 代码实现
实现中比较困难的部分是归并过程,在处理边界的时候,需要特别注意。示意图如下:
// 将 arr[l, ... , mid] 和 arr[mid, ... , r]两个部分进行归并 template <typename t> void __merge(t arr[], int l, int mid, int r) { t* aux = new t[r - l + 1]; // 辅助空间 for(int i = l; i<=r; i++) { aux[i - l] = arr[i]; } int i = l, j = mid + 1; for(int k = l; k <= r; k++) { if( i > mid) { arr[k] = aux[j - l]; j++; } else if (j > r) { arr[k] = aux[i - l]; i++; } else if(aux[i - l] < aux[j - l]) { arr[k] = aux[i - l]; i++; } else { arr[k] = aux[j - l]; j++; } } delete[] aux; } // 递归使用归并排序, 对arr[l, ... , r]的范围的数据进行排序 template <typename t> void __mergesort(t arr[], int l, int r) { // 递归到底层的情况 if( r - l <= 15 ){ sortbase::insertionsort(arr, l, r); return; } int mid = l + (r - l)/2; // 防止溢出:同时,不能是 r + (l - r) / 2 。 比如: l = 0, r = 1 __mergesort(arr, l, mid); __mergesort(arr, mid + 1, r); if(arr[mid] > arr[mid + 1]) { __merge(arr, l, mid, r); } } template <typename t> void mergesort(t arr[], int n) { __mergesort(arr, 0, n-1); }
2.3 自底向上的归并
自底向上的归并排序不如自顶向下的归并好理解。但是可以不写递归函数,并且可以访问数组索引。
有道面试题:对于一个链表(每个节点存储一个数据),要求在 o(nlogn)时间内完成排序,并且使用常数级别的空间。利用的就是
先看自底向上的归并的实现,就会有思路了:
template <typename t> void mergesortbu(t arr[], int n) { int min_size = -1; for(int sz = 1; sz <= n; sz += sz) { for(int i = 0; i + sz < n; i += sz + sz) { // i + sz < n: 保证第二部分的数组存在,并且 i + sz -1 不越界 // 对 arr[i, ... ,i+sz-1] 和 [i+sz, ... ,i+2*sz-1] 进行归并 if(arr[i + sz - 1] > arr[i + sz]) { __merge(arr, i, i + sz -1, min(i + sz + sz -1, n-1)); } } } }
这段代码是针对数组的,如果针对链表,只需要移动指针即可,而空间也可以新开一个指针空间做原地操作。
3. 快速排序
3.1 二路快速排序
3.1.1 三处优化
第一处优化是关于递归到底层的时候,比如被切分出来的数据长度小于 15,此时可以使用插入排序来优化。
第二处优化是:随机选择标定元素。一般的快排选定的是最左边的元素作为标定元素,排序后的数组标定元素移动到应该所处的位置,其前面是比他小的元素,后面是比他大的元素。
然而,无法保证快速排序递归树的平衡度。比如:2, 2, 2,..., 2, 1
近乎有序且有大量重复的数组。如果选定最左边,快速排序就会退化到 o(n*n)。如下图所示:
优化方法是:随机选择一个元素,与第一个元素交换后作为标定元素。这样可以保证递归树深度的期望值是 logn。
第三处优化是针对数组中有大量重复元素的情况。在执行partition
操作的时候,判断是否移动交换元素的条件算上=
即可。(具体可以看之后代码)
3.1.2 代码实现
template <typename t> int __partition2(t arr[], int l, int r) { swap(arr[l], arr[rand()%(r - l + 1) + l]); // 随机化防止树不平衡 t v = arr[l]; // arr[l+1, ... , i) <= v; arr(j, ... , r] >= v int i = l + 1, j = r; while(true) { while(i <= r && arr[i] < v) i++; while(j >= l+1 && arr[j] > v) j--; if(i > j) break; swap(arr[i], arr[j]); i ++; j --; } swap(arr[l], arr[j]); return j; } template <typename t> void __quicksort(t arr[], int l, int r) { if(r - l <= 15) { sortbase::insertionsort(arr, l, r); return; } int p = __partition2(arr, l, r); __quicksort(arr, l, p-1); __quicksort(arr, p+1, r); } template <typename t> void quicksort(t arr[] ,int n) { srand(time(null)); __quicksort(arr, 0, n-1); }
3.2 三路快速排序
三路排序和二路不同的是:将相同的元素单独放在一起,每次递归不再参与排序。
代码中各个边界变量的含义如下图所示:
代码实现:
template <typename t> void __quicksort3ways(t arr[], int l, int r) { if(r - l <= 15) { sortbase::insertionsort(arr, l, r); return; } swap(arr[l], arr[rand() % (r - l + 1) + l]); t v = arr[l]; int lt = l; // arr[l + 1, ... , lt] < v int gt = r + 1; // arr[gt, ... ,r] > v int i = l + 1; // arr[lt + 1, ... , i) == v while( i < gt ) { if(arr[i] < v) { swap(arr[i], arr[lt + 1]); lt ++; i ++; } else if(arr[i] > v) { swap(arr[i], arr[gt - 1]); gt --; } else { i ++; } } swap(arr[l], arr[lt]); __quicksort3ways(arr, l, lt-1); __quicksort3ways(arr, gt, r); }
4. 性能测试
4.1 测试随机数据
为了保证普适性,先测试大量随机数据的算法表现:
#include <iostream> #include "sorthelper.h" #include "sortbase.h" #include "sortadvance.h" using namespace std; int main() { int n = 100000, left = 0, right = n; int *arr = sorttesthelper::generaterandomarray<int>(n, left, 5); int *brr = sorttesthelper::copyarray<int>(arr, n); int *crr = sorttesthelper::copyarray<int>(arr, n); int *drr = sorttesthelper::copyarray<int>(arr, n); sorttesthelper::testsort<int>(brr, n, sortadvance::mergesort<int>, "merge sort"); sorttesthelper::testsort<int>(crr, n, sortadvance::mergesortbu<int>, "merge sort from bottom to up"); sorttesthelper::testsort<int>(drr, n, sortadvance::quicksort<int>, "quick sort"); return 0; }
结果如下:
对于特殊数据,例如含有大量重复元素的数组:
// ... int *arr = sorttesthelper::generaterandomarray<int>(n, left, 5); // ...
结果如下图所示:
4.2 1 亿数据量测试
因为使用的 clion 做了安全限制,所以当数组大小开到 100w 的时候,就报出堆栈错误。
换用了 devc 来跑 1 亿的数据,快排本来是 17s(忘记截图了),再跑就是 27s,如下图所示:
大家可以在自己电脑跑一下百度百科的快排,就知道优化的作用了 :)
5. 感谢
本篇博客是总结于慕课网的的笔记,liuyubobobo 老师人和讲课都很 nice,欢迎去买他的课程。