b 樹的時間複雜度 植樹節,那些年程式猿種的那些樹

2021-10-18 08:10:36 字數 3256 閱讀 6291

公曆 3 月 12 日是一年一度的植樹節。旨在宣傳保護森林,並動員群眾參加植樹造林活動。

說到樹,程式猿們肯定不陌生,趁著這個植樹節到來之時普及一下程式猿們經常遇見的樹。

**:五分鐘學演算法

定義二叉搜尋樹又稱二叉查詢樹,亦稱為二叉排序樹。設 x 為二叉查詢樹中的乙個節點,x 節點包含關鍵字 key,節點x 的 key 值記為 key[x] 。如果 y 是 x 的左子樹中的乙個節點,則 key[y] <= key[x] ;如果 y 是 x 的右子樹的乙個節點,則 key[y] >= key[x] 。

查詢效能

當資料數目為 n,樹高度保持 logn 附近。則平均查詢長度與 logn 成正比,查詢平均時間複雜度為 o(logn) 。 當先後插入的關鍵字有序時,二叉搜尋樹退化成單支樹結構。此時樹高 n 。平均查詢長度為 (n+1)/2 ,查詢的平均時間複雜度為 o(n) 。

插入效能

插入效率與查詢效率一致。

刪除效能

刪除節點時,若節點為葉子節點,或者節點只有單一子樹,則時間複雜度為 o(1) 。若節點既有左子樹又有右子樹,則需要執行遞迴過程,對應時間複雜度為 o(logn) 。

應用場景

二叉排序樹就既有鍊錶的好處,也有陣列的好處,因此在處理大批量的動態的資料是比較有用

定義平衡二叉樹是一種特殊的二叉搜尋樹。平衡二叉樹保證節點平衡因子的絕對值不超過1,保證了樹的平衡

查詢效能

平衡二叉樹是嚴格平衡的,那麼查詢過程與二叉搜尋樹一樣,只是平衡二叉樹不會出現最差的單支樹情形。因此查詢效率最好,最壞情況時間複雜度為 o(logn) 。

插入效能

插入資料之前需要進行查詢操作,查詢到插入位置。插入資料後需要進行旋轉操作,旋轉操作複雜度為常量級。因此插入資料的時間複雜度與查詢相同為 o(logn)。

刪除效能

刪除資料同樣需要查詢資料,在刪除資料後需要進行調整。一次刪除最多需要需要o(logn)次旋轉,因此刪除資料的時間複雜度為o(logn)+o(logn)=o(2logn)。

應用場景

sgi/stl的 set/map 底層都是用紅黑樹(平衡二叉樹的一種)實現的。

定義平衡二叉樹的嚴格平衡策略以犧牲建立查詢結構(插入,刪除操作)的代價,換來了穩定的o(logn) 的查詢時間複雜度。紅黑樹採用了折中策略,即不犧牲太大的建立查詢結構的代價,同時又能保證穩定高效的查詢效率。

查詢效能

由於紅黑樹的性質(最長路徑長度不超過最短路徑長度的 2 倍),可以說明紅黑樹雖然不像平衡二叉樹一樣是嚴格平衡的,但平衡效能還是要比二叉搜尋樹要好。其查詢代價基本維持在 o(logn) 左右,但在最差情況下(最長路徑是最短路徑的 2 倍少 1),比平衡二叉樹效率低一些。

插入效能

紅黑樹插入結點時,需要旋轉操作和變色操作。但由於只需要保證紅黑樹基本平衡就可以了。因此插入結點最多隻需要2次旋轉,這一點和平衡二叉樹的插入操作一樣,但是變色操作的時間複雜度為o(logn)。

刪除效能

紅黑樹的刪除操作代價要比平衡二叉樹要好的多,刪除乙個結點最多隻需要 3 次旋轉操作,保證了刪除時間複雜度維持在常量級。

應用場景

應用場景有很多。

種樹

定義b樹是一種多路平衡查詢樹,在相同資料數目情形下,b樹的高度更小,這樣就減少了磁碟的io次數,在檔案系統以及資料庫索引等場景下提公升了查詢效率。

查詢效能

b樹的查詢分成兩種:一種是從乙個結點查詢另一結點的位址的時候,需要定位磁碟位址(查詢位址),查詢代價極高。另一種是將結點中的有序關鍵字序列放入記憶體,進行優化查詢(可以用折半),相比查詢代價極低。而b樹的高度很小,因此在這一背景下,b樹比任何二叉結構查詢樹的效率都要高很多。

插入效能

b樹的插入會發生結點的**操作。當插入操作引起了 s 個節點的**時,磁碟訪問的次數為 h (讀取搜尋路徑上的節點) +2s (回寫兩個**出的新節點) +1(回寫新的根節點或插入後沒有導致**的節點)。因此,所需要的磁碟訪問次數是 h+2s+1,最多可達到 3h+1。因此插入的代價較大。

刪除效能

b樹的刪除會發生結點合併操作。最壞情況下磁碟訪問次數是 3h=(找到包含被刪除元素需要h次讀訪問)+(獲取第2至h層的最相鄰兄弟需要h-1次讀訪問)+(在第3至h層的合併需要h-2次寫訪問)+(對修改過的根節點和第2層的兩個節點進行3次寫訪問)。

應用場景

b樹/b+樹主要用於磁碟檔案組織 資料索引和資料庫索引等場景。

種樹

定義b+樹是b-樹的一種變體,b+樹相比b-樹的特點:

(1)索引節點的key值均會出現在葉子節點中。

(2)索引節點中的key值在葉子節點中或者為最大值或者為最小值。

(3)葉子節點使用單鏈表的形式鏈結起來。

查詢效能(1)在相同數量的待查資料下,b+樹查詢過程中需要呼叫的磁碟io操作要少於普通b-樹。由於b+樹所在的磁碟儲存背景下,因此b+樹的查詢效能要好於b-樹。

(2)b+樹的查詢效率更加穩定,因為所有葉子結點都處於同一層中,而且查詢所有關鍵字都必須走完從根結點到葉子結點的全部歷程。因此同一顆b+樹中,任何關鍵字的查詢比較次數都是一樣的。而b樹的查詢是不穩定的。

插入效能

b+樹的插入過程與b樹類似,效能也基本一致。

刪除效能

刪除效能與b樹也基本一致。

應用場景

b樹/b+樹主要用於磁碟檔案組織 資料索引和資料庫索引等場景。

種樹

定義給定 n 個權值作為 n 個葉子結點,構造一棵二叉樹,若該樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優二叉樹,也稱為霍夫曼樹(huffman tree)

霍夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。

應用場景

霍夫曼樹主要用於霍夫曼編碼,進行資料壓縮領域。

end今日互動,上面這六種樹中,你爬過哪幾種樹?

c map 平衡樹 植樹節,程式猿種的那些樹

公曆 3 月 12 日是一年一度的植樹節。旨在宣傳保護森林,並動員群眾參加植樹造林活動。說到樹,程式猿們肯定不陌生,趁著這個植樹節到來之時普及一下程式猿們經常遇見的樹。定義二叉搜尋樹又稱二叉查詢樹,亦稱為二叉排序樹。設 x 為二叉查詢樹中的乙個節點,x 節點包含關鍵字 key,節點x 的 key 值...

b 樹時間複雜度 第2天 演算法複雜度

作為一名合格的計算機人員,無論是做開發還是研究演算法,乙個程式的演算法複雜度顯得尤為重要。因此,一般我們在大一的時候,無論在學哪門程式語言之前都會提到演算法的時間複雜度。但是均不會提的太深。但是作為一名從事計算機開發人員,我們應該深入了解時間複雜度是特別有必要的。接下來就給大家深入的分析一下時間複雜...

時間複雜度的那些事

按數量級遞增排列依次為 常數階o 1 對數階o log2n 線性階o n 線性對數階o nlog2n 平方階o n 2 立方階o n 3 k次方階o n k 指數階o 2 n 1.一般情況下,演算法中基本操作重複執行的次數是問題規模n的某個函式,用t n 表示,若有某個輔助函式f n 使得當n趨近於...