欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

无序数组中的第k大元素:快速排序和堆排序

程序员文章站 2024-03-15 22:22:18
...

找到无序数组中的第k大元素, kth_Largest_element_in_an_array。
常见的解决方案有两种,快速排序思想和堆排序思想,简单记录一下过程,顺便复习快速排序和堆排序过程。

快速排序思想

快速排序的理论基础是随机取一个数,大的放左边,小的放右边,完成一趟排序。
分别对左右两边递归做相同的分割,最后还剩一个数,自然有序,完成快速排序。
那么找第k大的元素,即完成一次排序后,随机找出的这个数的前面有 k -1个数,那么就是第k大个元素。
下标: k - 1 = index.
否则再根据下标关系判断在k在左边还是右边,继续如上操作。
快速排序完成一次排序的函数如下:

# 最后一个数为支点,从小到大排序
def partition_two(array, lo, hi):
    i = lo
    j = hi
    while i < j:
        while i < j and array[i] <= array[hi]:
            i += 1
        while i < j and array[j] >= array[hi]: # =保证支点不变,可以后续比较。
            j -= 1
        array[i], array[j] = array[j], array[i]
    array[i], array[hi] = array[hi], array[i]
    return i

下面得到分界点的下标,对左右两边递归分割,完成排序:

# 快速排序
def quick_sort(array, lo, hi):
    #参数合法性
    if array is None or lo >= hi:
        return
    mid = partition_two(array, lo, hi)
    quick_sort(array, lo, mid - 1)
    quick_sort(array, mid + 1, hi)

找第k大元素的代码类似。

堆排序思想

首先堆不作介绍,分为大根堆和小根堆。堆的操作有插入和删除最大(小)元素,插入的节点放在最后,然后进行堆化操作。
堆的一个经典实现是完全二叉树,这样实现的堆为二叉堆。
下面是数组进行从小到大的堆排序过程。

堆化数组

一个随机数组,对根节点i进行堆化操作(i的左右子树也都是堆)。
选择左右节点的小节点与根节点比较,若是根节点还小于较小值,则满足堆的性质。
否则进行交换,对交换过的节点继续进行堆化操作,直至全部堆化。

#对数组来说,以下标index为根节点的左右子树的下标为 index * 2 + 1, index * 2 +  2
# 将length个元素,i为节点的数组堆化(i的子节点也都是堆)
def big_heap_array(array, i, length):
    # 左叶子节点
    temp_value = array[i]
    node_index = (i << 1) + 1
    while node_index < length:
        #左右叶子节点的较大值
        if node_index + 1 < length and array[node_index + 1] > array[node_index]:
            node_index = node_index + 1
        # 如果根节点大于叶子节点,说明已经是堆,退出循环。
        if array[node_index] < temp_value:
            break
        array[i] = array[node_index]
        # 调整交换过元素的子节点
        i = node_index
        node_index = (i << 1) + 1
    array[i] = temp_value

上面操作是堆化i下标节点的数组,从小到大的排序过程如下:

  1. 从最后一个根节点开始,往上进行堆化, 此时array[0] 为最大值。
  2. 交换array[0]和最后一个元素,此时再进行堆化,得到最小的元素与倒数第二个元素,逐次完成从小到大排序。
#n长度的数组,最后一个根节点的下标为: n / 2 - 1
#构建最大堆,从小到大排序
def heap_sort_one(array):
    # 最后一个跟节点
    last_node_index = (len(array) >> 1) - 1
    for node_index in range(last_node_index, 0 - 1, -1):  #[llast_node_index .. 0] 的列表
        big_heap_array(array, node_index, len(array))
    # 堆顶最大值和最后一个数互换, 然后堆化数组
    for index in range(len(array) - 1, 0, -1):
        array[0], array[index] = array[index], array[0]
        big_heap_array(array, 0, index)

下面来解决此问题。
首先利用数组的前k个元素建立一个k大小的小根堆。逐次取后面的元素与堆顶比较, 如果大于堆顶,则替换堆顶,然后进行堆化。最终结果就是最大的前k个元素都在堆中,其中堆顶元素堆小,就是第k大的元素。

寻找的代码见github:https://github.com/yunshuipiao/sw-algorithms