欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

第六章节 优先队列/堆

程序员文章站 2022-05-23 10:12:46
...

一般发送到打印机的作业 放到队列中,但这并不一定是最好的做法 ,比如可能有一个作业很重要,可以先打印,这个时候,就可以用到优先队列。

另外,短的作业一般应该首先完成 ,因此,在运行的程序中,短的作业有更高的优先权。

一、模型

优先队列一定要有的两个操作:insert  ,deleteMin(找到并删除最小的).

其中,insert相当于队列中的enqueue, deleteMin类似于队列中的dequeue.

二、一些简单的实现 

有几种简单的办法可以实现

  • 使用简单的链表

在表头以O(1)进行插入,遍历以O(N)删除最小的.或者使链表保存有序的状态,则insert 要O(N), 而deleteMin要O(1).

  • 使用二权查找树

deleteMin/ insert复杂度都是 O(logN).但是使用插找树有些过份了,因为它还支持很多别的工作,此外,在删除的最坏的情况下,会有失去平衡等问题。

  • 二叉堆

不需要用到链,支持最坏的情形时O(logN),且插入操作平均用时为常数时间。

三、二叉堆

对于优先队列的实现时,使用的很普遍。和二叉查找树一样,堆也有两个性质,结构性与堆序性。对堆的操作可能破坏其中的一个,因此,堆 的操作一定要

到堆的所有性质都满足才终止。

  • 性质结构 

堆是一个完全填满的二叉树。一个完全二叉树可以用数组表示。对一个位置i的元素,左儿子在2i,右儿子在2i+1.父亲在i/2取整数。因此我们不用使用链,而且遍历很简单。唯一的问题是

要先估计大小 。

一个堆结构由一个comparable对象数组与一个代表当前堆大小的整数组成。如下,是一个堆

 

package c6;

public class BinaryHeap<AnyType extends Comparable<? super AnyType>> {
	
	private static final int DEFAULT_CAP=10 ;
	private int currentSize ;
	private AnyType [] array ;
	
	public BinaryHeap(){
		
	}
	public BinaryHeap(int cap){
		
	}
	public BinaryHeap(AnyType [] items){
		currentSize = items.length ;
		array = (AnyType [])new Comparable[(currentSize+2)*11/10];
		int i=1;
		for (AnyType item : items){
			array[i++] = item ;
		}
		buildHeap() ;
	}
	/**
	 * 平均2.6,也就是O(1),最坏insert最小的元素时发生,O(lgN)
	 * @param x
	 */
	public void insert(AnyType x ){
		if (currentSize== array.length-1)
			enlargeArray(array.length*2+1) ;
		
		//percolate up 
		int hole = ++ currentSize ;
		for(; hole>1 && x.compareTo(array[hole/2])<0;hole/=2){
			array[hole] = array[hole/2] ;
		}
		array[hole] =x ;
	}
	public AnyType findMin() throws Exception{
		if (isEmpty())
			throw new Exception() ;
		return array[1] ;//array[0]没有用?
	}
	/**
	 * O(lgN)--最坏和平均都是,因为要percolateDown
	 * @return
	 * @throws Exception
	 */
	public AnyType deleteMin() throws Exception{
		if (isEmpty())
			throw new Exception();
		AnyType minIten = findMin();
		//将array[currentSize]移动到空穴,再将currentSize-1
		array[1] = array[currentSize--] ;
		percolateDown(1) ;
		return minIten ;
	}
	public boolean isEmpty(){
		return currentSize==0 ;//?是否有问题
	}
	public void makeEmpty(){
		
	}
	/**
	 * 删除的时候用到
	 * @param hole 空穴,这里是用的堆最后的一个元素 
	 */
	private void percolateDown(int hole){
		int child ;
		AnyType temp = array[hole] ;
		for (;2*hole<= currentSize;hole = child){
			child = 2*hole;
			//有两儿子时(child!=currentSize),先出两个小的一个
			if (child!= currentSize && array[child+1].compareTo(array[child])<0){
				child++ ;
			}
			//空穴往下滤
			if (array[child].compareTo(temp)<0){
				array[hole] = array[child] ;
			}else {
				break ;
			}
		}
		array[hole] = temp ;
	}
	/**
	 * O(N),这个操作从下而上,不能反
	 */
	private void buildHeap(){
		for (int i= currentSize/2 ;i>0;i--){
			percolateDown(i);
		}
	}
	private void enlargeArray(int newSize){
		
	}
	
}

  

 

  • 堆性质

一个堆中,对于每一个节点X, X的父亲的关键字小于或者等于X中的关键字。因此,最小的元素就在根处。

堆的基本操作

insert 

在下一个可用的位置放一个空穴:

如果 X可以放在这个空穴中,则完成。

如果不可,将空穴的父节点放到 空穴中,这样空穴就上移,直到X能放入空穴为止。

这种操作是上滤。新的元素在堆中上滤直到找到正确的位置。

如果插入的是最小元素,则要上滤到根处,将用时O(logN),平均来看,性能好很多,插入一次只要2.6次比较。性能好很多。

deleteMin 

找到最小元素是简单的,但是删除比较复杂。

当删除一个最小元素时,根处出现 一个空穴,由于现在堆少了一个元素,因此堆中的最后一个元素X要移动到一个地方。

如果X可以直接放到空穴中,删除完成 。

如果不可以,将空穴的两儿子中小的移动到空穴,这样空穴下滤一层,重复上过程直到X可放到空穴中。

因此 ,做法就是将X放到沿着根开始,有最小儿子的一条路径 上的一个正确 的路径上。

对于一个节点如果只有一个儿子,我们要进行附加的测试,

这种操作的最坏情况运行时间为O(logN),平均来说,也是O(logN).

其它操作

事实上一个堆所蕴含的有序信息很少,如果不对整个堆进行线性搜索,是没有办法找到任何特定的关键字的。

buildHeap操作

可以将N个元素insert到一个空堆中,每一个insert将花费O(1)的平均时间和O(logN)的最坏时间,因此整个过和将花费O(N)平均时间,而不是O(NlogN)最坏时间。这是一种特殊的指令,没有

别的操作干扰。

一般的算法 是将N项以任意的顺序放到树中,保持结构特性,然后再percolatedown (i),以构造一个堆序的树。

四、优先队列的使用

选择问题

从N个元素中找出第k个最大的元素。下面给出两个在 k=N/2时,最坏以O(NlogN)运行的算法 。

算法1

只考虑找到第k个最小的元素,将N个元素读入数组,进行buildHeap算法 ,最后,进行k次deleteMin,得到结果。使用的时间为

O(N+k*logN)。如果 k很大,则为O(klogN),如果 k=N/2则为O(NlogN).如k=N,则相当于给N个元素进行了排序。

算法2

我们维持一个大小为k的堆,根元素就是这个小集合中最小的,再读入一个新的元素,与根进行比较。(略)。

除了不能进行find操作,堆最大的缺点是将两个堆合并是一个很困难的操作。下面讨论几个可以支持以O(NlogN)的时间进行merge的数据结构。