優先順序佇列之堆的分析與實現

在現實應用中，我們有這樣一種需求，就是選取出當前佇列中優先順序最高的元素，比如作業系統中的執行緒排程，當前執行緒時間片用完的時候，需要從就緒佇列中選出優先順序最高的執行緒，對於乙個無序佇列，我們需要遍歷所有的元素，那麼時間複雜度就是o（n）。研究優先順序佇列的目的就是找到一種資料結構和對應的演算法，實現高效的動態和靜態操作。這裡的動態操作指的是插入和刪除元素，靜態操作指的是查詢。需要注意的是，刪除操作和查詢操作都只是針對優先順序最高的元素。於是我們可以給出乙個優先順序佇列的虛基類的定義。

template struct pq//其實這只是一種adt(abstract data type)，需要根據不同的應用場景具體實現，對應的效率也不相同

優先順序佇列只是一種概念上的範圍，我們可以有多種實現方法，這裡介紹幾個最簡單的方法，分別用向量、有序向量、bbst（balanced binary search tree，平衡二叉查詢樹）來實現pq（priority queue，下面簡稱pq），下表列出了插入、刪除和查詢優先順序最高元素的時間複雜度。

實現型別\抽象介面

insert()

getmax()

delmax()

向量o(1)

o(n)

有序向量

o(n)

o(1)

bbst

o(logn)

這裡簡單說一下為什麼時間複雜度如上表所示。對於無序向量來說，插入元素很簡單，直接插到末尾就行，所以是o(1),getmax和delmax都需要遍歷所有元素，其中delmax在刪除元素之後還要移動後續元素，可以說，delmax在最壞情況下需要做接近2n次操作，但是在近似意義下都是o(n)。對於有序向量來說，我們可以按從小到大排序，這時候插入元素在最壞情況下需要移動接近n個元素，所以是o(n),而getmax和delmax都可以直接對最後乙個元素操作（按照從小到大排序，最後乙個元素優先順序最高），所以是o(1)。bbst比較複雜，我們知道對於bbst來說，我們是search，insert還是remove介面（bbst的三個標準介面，在實現insert，getmax和delmax時可以直接呼叫）的時間複雜度都是o(logn)，但是bbst本身實現起來過於複雜，而且它相對於pq來說功能過於強大，比方說，對於insert介面來說兩者功能類似，但是對於getmax和delmax來說，pq只需要一種偏序關係，即pq只需要對優先順序最高的元素進行操作，但是bbst可以對任何元素操作。我們希望找到一種簡單的資料結構，它既可以容易實現與維護，又能高效實現上述三個功能介面，下面我們介紹完全二叉堆。

完全二叉堆實際上就是在上述需求背景下產生的，事實上它同時結合了向量的形和樹的神，向量的形是指它的儲存結構和向量一樣，樹的神是指從邏輯上我們把它理解成樹。乙個向量如果想理解成樹，事實上只有在完全二叉樹的情況下才有可能，這時樹是按層次遍歷的順序存在向量裡的，完全二叉堆的乙個重要特徵是堆序性，簡單來說就是父節點一定不小於子節點，因此整個堆中的最大節點就一定是根節點，所以getmax介面非常容易實現，只需要返回_elem[0]即可，時間複雜度是o(1)，接下來我們分析框架類裡實現的另兩種介面的實現方案和實現效率。

對於insert()，實際上是乙個上濾的過程，新插入的節點首先放在向量的末尾，相當於在完全二叉樹的最後乙個節點，如果它有父親節點的話，就和父親節點比較，如果大於父親節點就互換，然後繼續和新的父親節點比較直至小於新的父節點或者抵達根節點，下面是對應**,首先我們先給出用完全二叉堆的類定義。

template class pq_complhead:public pq,public vector;
t delmax();
}

接下來我們來看insert介面的實現

template void pq_comlheap::insert(t e)
template int pq_complheap::percolateup(int i)
return i;
}

接下來分析刪除操作，刪除操作只是針對最大元素，所以只需要刪除掉_elem[0]即可，問題的關鍵是，在刪除掉_elem[0]之後如何保持堆序性。原理是：首先將最後乙個節點放在根節點的位置，然後執行下濾操作。無論是上濾操作還是下濾操作，雖然不是一次就能完成，但是在操作的過程中能保證單調性，即問題始終在逐漸簡化，下面給出**。

template t pq_complheap::delmax()

template int pq_complhead::percolatedown(int n,int i)
return i;
}

ok,到這裡完全二叉堆的基本框架和演算法時間都完成了，下面我們分析效能。

這裡我們和之前的三種實現方式做以對比,這裡先給出時間複雜度，再介紹這個時間複雜度是如何算出來的。

實現型別\抽象介面

insert()

getmax()

delmax()

向量o(1)

o(n)

有序向量

o(n)

o(1)

bbst

o(logn)

完全二叉堆

o(logn)

o(1)

o(logn)

對於getmax來說，時間複雜度是o(1)應該很好理解，因為只需要取_elem[0]就行了，insert操作其實最主要的就是乙個上濾過程，這個過程每次都會至少上公升一層，每次上公升只需要做常數次比較操作，而完全二叉堆是嚴格意義上最多只有logn層，所以它的時間複雜度是o(logn)。其實delmax()操作和insert類似，需要做乙個下濾操作，在每層也需要做常數次比較操作，然後下降一層，在最壞情況下也不過是下降logn層，所以也是o(logn)。

由堆衍生而來的堆排序演算法思路也非常簡單，不過是每次取出最大的元素然後輸出就可以了，每次取出最大元素都要執行一次getmax()和delmax()，時間複雜度為o(logn+1)，也就是o(logn)，一共執行n次，所以總體的時間複雜度是o(n*logn)，這也是全排序演算法中效率最高的情況了，當然我們可以對它做常數意義下的優化。

接下來我們介紹另一種堆，它是為了彌補二叉完全堆在某些特定應用場景下的不足應運而生的。

左式堆是為了高效的實現兩個堆的合併（merge）操作，設想一下，如果用完全二叉堆我們如何實現兩個堆的合併呢？假設有兩個堆，堆a和堆b，我們可以首先判對一下它們的長度，不失一般性，假設size(a)>size(b)，一種很簡單的演算法就是不斷輸出b堆的資料插入到a堆中去，每次插入的時間複雜度都是logn，假設b堆有m個元素，那就是mlogn，一般我們認為n和m是同階的，那就是o(nlogn)，這種效能開銷我們是無法接受的，因為我們把堆a和堆b中的元素混搭在一起，重新排序也就是o(n*logn)的時間複雜度，而且堆是一種偏序關係（偏序關係體現在只要能找到最大或最小元素即可），那麼它的開銷應該小於全排序才行，所以我們引入左式堆。

這裡我們引入乙個npl的概念，npl是null path length的縮寫，它是指對應節點到外部節點的最近距離，這裡引入兩條規則：

npl(null)=0;

npl(x)=1+min(npl(lc(x)),npl(rc(x)));

我們首先給出左式堆的類定義，**如下。

template class pq_leftheap:public pq,public bintree
t delmax();
}

在滿足左傾性的情況下，我們給出一種遞迴的合併演算法的實現，**如下。

template static binnodeposi(t) merge(binnodeposi(t) a,binnodeposi(t) b)

先介紹到這兒吧，有機會我在詳細展開，讀者可以自己畫一些圖幫助理解一下。

優先順序佇列之堆的分析與實現

優先順序佇列之堆實現

優先順序佇列（堆實現）

優先順序佇列（堆實現）

優先順序佇列之堆的分析與實現

優先順序佇列之堆實現

優先順序佇列（堆實現）

優先順序佇列（堆實現）

相關推薦