Python 堆與堆排序

2022-04-07 04:12:50 字數 2495 閱讀 9310

堆排序快速排序歸併排序一樣都是時間複雜度為o(n*logn)的幾種常見排序方法。學習堆排序前,先講解下什麼是資料結構中的二叉堆。

二叉堆是完全二叉樹或者是近似完全二叉樹。

二叉堆滿足二個特性:

1.父結點的鍵值總是大於或等於(小於或等於)任何乙個子節點的鍵值。

2.每個結點的左子樹和右子樹都是乙個二叉堆(都是最大堆或最小堆)。

當父結點的鍵值總是大於或等於任何乙個子節點的鍵值時為最大堆。當父結點的鍵值總是小於或等於任何乙個子節點的鍵值時為最小堆。下圖展示乙個最小堆:

由於其它幾種堆(二項式堆,斐波納契堆等)用的較少,一般將二叉堆就簡稱為堆。

一般都用陣列來表示堆,i結點的父結點下標就為(i – 1) / 2。它的左右子結點下標分別為2 * i + 1和2 * i + 2。如第0個結點左右子結點下標分別為1和2。

下面先給出《資料結構c++語言描述》中最小堆的建立插入刪除的**,再給出本人的實現**,最好是先看明白圖後再去看**。

每次插入都是將新資料放在陣列最後。可以發現從這個新資料的父結點到根結點必然為乙個有序的數列,現在的任務是將這個新資料插入到這個有序資料中——這就類似於直接插入排序中將乙個資料併入到有序區間中,對照《白話經典演算法系列之二 直接插入排序的三種實現》不難寫出插入乙個新資料時堆的調整**:

//

新加入i結點 其父結點為(i - 1) / 2

void minheapfixup(int a, int

i)

a[i] =temp;

}

更簡短的表達為:

void minheapfixup(int a, int

i)

插入時:

//

在最小堆中加入新的資料nnum

void minheapaddnumber(int a, int n, int

nnum)

按定義,堆中每次都只能刪除第0個資料。為了便於重建堆,實際的操作是將最後乙個資料的值賦給根結點,然後再從根結點開始進行一次從上向下的調整。調整時先在左右兒子結點中找最小的,如果父結點比這個最小的子結點還**明不需要調整了,反之將父結點和它交換後再考慮後面的結點。相當於從根結點將乙個資料的「下沉」過程。下面給出**:

//

從i節點開始調整,n為節點總數 從0開始計算 i節點的子節點為 2*i+1, 2*i+2

void minheapfixdown(int a, int i, int

n)

a[i] =temp;

} //

在最小堆中刪除數

void minheapdeletenumber(int a, int

n)

有了堆的插入和刪除後,再考慮下如何對乙個資料進行堆化操作。要乙個乙個的從陣列中取出資料來建立堆吧,不用!先看乙個陣列,如下圖:

很明顯,對葉子結點來說,可以認為它已經是乙個合法的堆了即20,60, 65, 4, 49都分別是乙個合法的堆。只要從a[4]=50開始向下調整就可以了。然後再取a[3]=30,a[2] = 17,a[1] = 12,a[0] = 9分別作一次向下調整操作就可以了。下圖展示了這些步驟:

寫出堆化陣列的**:

//

建立最小堆

void makeminheap(int a, int

n)

至此,堆的操作就全部完成了(注1),再來看下如何用堆這種資料結構來進行排序。

首先可以看到堆建好之後堆中第0個資料是堆中最小的資料。取出這個資料再執行下堆的刪除操作。這樣堆中第0個資料又是堆中最小的資料,重複上述步驟直至堆中只有乙個資料時就直接取出這個資料。

由於堆也是用陣列模擬的,故堆化陣列後,第一次將a[0]與a[n - 1]交換,再對a[0…n-2]重新恢復堆。第二次將a[0]與a[n – 2]交換,再對a[0…n - 3]重新恢復堆,重複這樣的操作直到a[0]與a[1]交換。由於每次都是將最小的資料併入到後面的有序區間,故操作完成後整個陣列就有序了。有點類似於直接選擇排序

void minheapsorttodescendarray(int a, int

n)

}

注意使用最小堆排序後是遞減陣列,要得到遞增陣列,可以使用最大堆。

由於每次重新恢復堆的時間複雜度為o(logn),共n - 1次重新恢復堆操作,再加上前面建立堆時n / 2次向下調整,每次調整時間複雜度也為o(logn)。二次操作時間相加還是o(n * logn)。故堆排序的時間複雜度為o(n * logn)。stl也實現了堆的相關函式,可以參閱《stl系列之四 heap 堆》。

注1 作為乙個資料結構,最好用類將其資料和方法封裝起來,這樣即便於操作,也便於理解。此外,除了堆排序要使用堆,另外還有很多場合可以使用堆來方便和高效的處理資料,以後會一一介紹。

堆與堆排序

二叉堆是完全二叉樹或者是近似完全二叉樹。二叉堆滿足二個特性 1 父結點的鍵值總是大於或等於 小於或等於 任何乙個子節點的鍵值。2 每個結點的左子樹和右子樹都是乙個二叉堆 都是最大堆或最小堆 當父結點的鍵值總是大於或等於任何乙個子節點的鍵值時為最大堆。當父結點的鍵值總是小於或等於任何乙個子節點的鍵值時...

堆與堆排序

堆排序與快速排序,歸併排序一樣都是時間複雜度為o n logn 的幾種常見排序方法。堆排序是就地排序,輔助空間為o 1 它是不穩定的排序方法。排序的穩定性是指如果在排序的序列中,存在前後相同的兩個元素的話,排序前 和排序後他們的相對位置不發生變化 先說說什麼是堆,堆通常是乙個可以被看做一棵樹的陣列物...

堆與堆排序

堆排序與快速排序,歸併排序一樣都是時間複雜度為o n logn 的幾種常見排序方法。學習堆排序前,先講解下什麼是資料結構中的二叉堆。二叉堆是完全二叉樹或者是近似完全二叉樹。二叉堆滿足二個特性 1 父結點的鍵值總是大於或等於 小於或等於 任何乙個子節點的鍵值。2 每個結點的左子樹和右子樹都是乙個二叉堆...