欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

图解排序算法(三)之堆排序

程序员文章站 2022-06-06 20:39:15
...

堆排序

堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。

堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:

堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:

图解排序算法(三)之堆排序

 

同时,我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子

 

图解排序算法(三)之堆排序

按层编号

该数组从逻辑上讲就是一个堆结构,我们用简单的公式来描述一下堆的定义就是:

大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]
小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]
ok,了解了这些定义。接下来,我们来看看堆排序的基本思想及基本步骤:

堆排序基本思想及步骤

堆排序的基本思想是:将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

1.假设给定无序序列结构如下

图解排序算法(三)之堆排序

无序序列结构

2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。

图解排序算法(三)之堆排序

image

3.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。

图解排序算法(三)之堆排序

image

这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。

 

图解排序算法(三)之堆排序

image

 

此时,我们就将一个无需序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

a.将堆顶元素9和末尾元素4进行交换

 图解排序算法(三)之堆排序调整结构,使其继续满足堆定义

图解排序算法(三)之堆排序

image

c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.

图解排序算法(三)之堆排序

后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

再简单总结下堆排序的基本思路:
a.将无需序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;
b.将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;
c.重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,直到整个序列有序。

代码实现

package com.smart.algorithm.sort;

import java.util.Arrays;

/**
 * Created by fc.w on 2017/10/29.
 */
public class HeapSort5 {

    public static void main(String[] args) {
        int []arr = {4,2,7,6,1,9,3,8,5};
        sort(arr);
        System.out.println(Arrays.toString(arr));
    }

    public static void sort(int[] arr) {
        for (int i = 0; i < arr.length; i++) {
            // 从最后一个非叶子节点从左到右,从下到上调整结构
            createHeap(arr, arr.length - i - 1);
            // 将堆顶元素与末尾元素交换位置
            swap(arr, 0, arr.length - i - 1);
        }
    }

    /**
     * 构建堆
     * @param arr
     * @param lastIndex
     */
    public static void createHeap(int[] arr, int lastIndex) {
        for (int i = (arr.length / 2) - 1; i >= 0; i--) {
            // 非叶子节点下标
            int t = i;
            while ((t * 2 + 1) <= lastIndex) {
                int bigIndex = t * 2 + 1;
                if (bigIndex < lastIndex) {
                    if (arr[bigIndex] < arr[bigIndex + 1]) {
                        bigIndex++;
                    }
                }

                if (arr[bigIndex] > arr[t]) {
                    // 交换非叶子节点元素的位置
                    swap(arr, bigIndex, t);
                    // 将元素下标赋值,便于之后的非叶子节点调整树结构
                    t = bigIndex;
                } else {
                    break;
                }

            }
        }
    }

    /**
     * 交换元素位置
     * @param arr
     * @param i
     * @param j
     */
    public static void swap(int[] arr, int i, int j) {
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }

}

 结果

[1, 2, 3, 4, 5, 6, 7, 8, 9]

总结

堆排序是一种选择排序,整体主要由构建初始堆+交换堆顶元素和末尾元素并重建堆两部分组成。其中构建初始堆经推导复杂度为O(n),在交换并重建堆的过程中,需交换n-1次,而重建堆的过程中,根据完全二叉树的性质,[log2(n-1),log2(n-2)...1]逐步递减,近似为nlogn。所以堆排序时间复杂度一般认为就是O(nlogn)级。

参考资料

[1]From 图解排序算法(三)之堆排序