最佳歸併樹

2022-06-11 21:36:17 字數 1659 閱讀 8658

目錄知識回顧

讀寫磁碟需要2*(6+8+14+16)

每個初始歸併段看作乙個葉子結點,歸併段的長度作為結點權值,則上面這顆歸併樹的帶權路徑長度wpl=2 * 1+(5+1+6+2) * 3 = 44 =讀磁碟的次數 = 寫磁碟的次數

wpl:結點值*到根節點的路徑長度

重要結論:歸併過程中的磁碟i/o次數 = 歸併樹的wpl * 2

可以想到:如果要追求歸併過程中的磁碟io次數最小,就要使歸併樹wpl最小——哈夫曼樹

一開始把每乙個結點都看成乙個個獨立的樹,接下來在這幾顆樹中挑選權值最小的兩棵樹,讓他們稱為兄弟。新的結點的權值是這兩個孩子結點的權值之和。還剩下4顆樹

。。。如此操作。。。

\[最佳歸併樹wpl_ = (1+2)*4+2*3+5*2+6*1=34

\]讀磁碟次數 = 寫磁碟次數 = 34次

總的磁碟i/o次數 = 68

顯然不是最佳的歸併樹

原理和2路歸併類似,選擇權值最小的3個結點讓他們成為兄弟

\]歸併過程中 磁碟的i/o總次數 = 446次

要做3路歸併

不正確!!!!

最後一次歸併是2路歸併

對於k叉歸併,若初始歸併段的數量無法構成嚴格的k叉歸併樹,則需要補充幾個長度為0的」虛段「,在進行k叉哈夫曼樹的構造。

對於k叉歸併,若初始歸併段的數量無法構成嚴格的k叉歸併樹,則需要補充幾個長度為0的」虛段「,在進行k叉哈夫曼樹的構造。

k叉的最佳歸併樹一定是一棵嚴格的k叉樹,即樹中只包含度為k、度為0的結點。

智慧型分析最佳實踐 指標邏輯樹

所有業務都會面對 為什麼漲 為什麼降 原因是什麼?這種簡單粗暴又不易定位的業務問題。為了找出資料發生異動的原因,業務人員會通過使用多維查詢 dashboard等資料產品鎖定問題,再輔助人工分析查詢問題原因,這個過程通常需要一天時間。幾乎每種業務角色的使用者都在做相似的分析,但在業務方分析人員發生工作...

智慧型分析最佳實踐 指標邏輯樹

所有業務都會面對 為什麼漲 為什麼降 原因是什麼?這種簡單粗暴又不易定位的業務問題。為了找出資料發生異動的原因,業務人員會通過使用多維查詢 dashboard等資料產品鎖定問題,再輔助人工分析查詢問題原因,這個過程通常需要一天時間。幾乎每種業務角色的使用者都在做相似的分析,但在業務方分析人員發生工作...

7 7 3 多路平衡歸併與敗者樹

歸併趟數s logm r 向下取整 從而增加歸併路數m可以減少歸併趟數s,進而減少訪問外存的次數 i o次數 然而,當增加歸併路數m時,內部歸併時間將增加。做內部歸併時,在m個元素中選擇關鍵字最小的記錄需要比較m 1次。每趟歸併n個元素最多需要作 n 1 m 1 次比較,s趟歸併總共需要的比較次數為...