哈夫曼編碼

2021-09-06 10:34:31 字數 1766 閱讀 7666

哈夫曼編碼

•      編碼

普通的編碼都是定長的,比如常用的ascii編碼,每個字元都是8個bit

•      變長編碼

變長編碼比固定編碼好一些,即對頻率高的字元賦以短編碼,對頻率低的字元賦以長編碼。

a

b

c

d

e

f頻率

45 13

12 16

9 5

固定 000

001

010

011

100

101 變長

0 101

100

111

1101

1100

•      字首編碼

即較短的編碼不能是任何較長的編碼的字首,這樣解析的時候才不會混淆

•      字首碼生成方式(二叉樹)

把要編碼的字元放在二叉樹的葉子上,所有的左節點是0,右節點是1,從根瀏覽到葉子上,因為字元只能出現在樹葉上,任何乙個字元的路徑都不會是另一字元路徑的字首路徑,符合字首原則編碼就可以得到。

•      壓縮效率

•   可以看出,構造更優的二叉樹,原則就是權重越大的葉子,距離根應該越近,而我們的終級目標是生成「最優」的二叉樹,最優二叉樹必須符合下面兩個條件:

所有上層節點都大於等於下層節點。

某節點,設其較大的子節點為m,較小的子節點為n,m下的任一層的所有節點都應大於等於n下的該層的所有節點。

•  從各個節點中找出最小的兩個節點,給它們建乙個父節點,值為這兩個節點之和。

•  從節點序列中去除這兩個節點,加入它們的父節點到序列中。

•  重複上面兩個步驟,直到節點序列中只剩下唯一乙個節點。這時一棵最優二叉樹就已經建成了,它的根就是剩下的這個節點。

•   列出原始的節點資料

•      將最小的兩個節點c和e結合起來

•      再將新的節點和a組合起來

•   再將d節點加入

哈夫曼編碼 哈夫曼樹

1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....

哈夫曼樹 哈夫曼編碼

定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...

哈夫曼編碼 哈夫曼樹

哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...