哈夫曼編碼

2021-06-27 14:49:48 字數 2469 閱讀 6390

1、哈夫曼編碼簡介

哈夫曼編碼(huffman coding)是一種編碼方式,哈夫曼編碼是可變字長編碼(vlc)的一種。huffman於2023年提出一種編碼方法,該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,一般就叫做huffman編碼(有時也稱為霍夫曼編碼)。

2、哈夫曼編碼的核心思想

(1)每乙個字元用乙個0、1串作為其**,並要求任意乙個字元的**都不是其他字元**的字首;

(2)用字元在檔案中出現的頻率表來建立乙個用0、1串表示各字元 的最優表示方式,即使出現頻率高的字元獲得較短的編碼,出現頻率較低的字元獲得較長的編碼;

(3)將字元在檔案中出現的頻率值作為一棵二叉樹的葉子結點的權值,並通過構造一棵哈夫曼樹得到最優字首碼。

3、哈夫曼樹的構建

啥夫曼樹又稱最優二叉樹。它是由n個帶權葉子結點構成的所有二叉樹中,帶權路徑長度(即樹中所有葉子結點的帶權路徑長度之和)最小的二叉樹。

構造哈夫曼樹的步驟如下:

(1)用給定的n個權值對應的n個結點構成n棵二叉樹的森林f=,其中每一棵二叉樹ti(1<=i<=n)都有乙個權值為wi的根結點,其左右子樹為空;

(2)在森林f中選擇兩棵根結點權值最小的二叉樹,作為一棵新二叉樹的左右子樹,標記新二叉樹的根結點權值為其左右子樹的根結點權值之和;

(3)從f中刪除被選中的那兩棵二叉樹,同時把新構成的二叉樹加入到森林f中;

(4)重複(2)、(3)操作,直到森林中只含有一棵二叉樹為睛,此時得到的這種二叉樹就是哈夫曼樹,整個過程產生新結點n-1個,所以哈夫曼樹共有2*n-1個結點。

4、哈夫曼編碼

得到哈夫曼樹後,自頂向下按路徑編號,指向左節點的邊編號0,指向右節點的邊編號1,從根到葉節點的所有邊上的0和1連線起來,就是葉子節點中字元的哈夫曼編碼。

5、**實現

(1)實現的過程中,用於構建哈夫曼樹的權值存放在乙個陣列裡,陣列的前n個元素存放各字元權值,後n-1個元素存放新生成的結點權值;

(2)在這裡,採用從葉子開始直到根結點的形式獲取哈夫曼編碼

具體實現**如下:

#include #include using namespace std;

//哈夫曼樹編碼資料結構

typedef struct htcode

htcode,*htcodeptr;

//哈夫曼樹結點資料結構

typedef struct htnode

htnode,*htnodeptr;

//哈夫曼樹資料結構

typedef struct httree

httree,*httreeptr;

httreeptr createhuffmantree(int n, int w)

else

}for (int i = 0; i < n - 1; i++)//執行n-1次合併,生成n-1個新結點

else if (pht->ht[j].weight < min2)//查詢次小權值的結點,並用p2記錄下其位置

}} //對新生成的結點及其左右孩子設定引數

pht->ht[n + i].weight = min1 + min2;

pht->ht[n + i].lchild = p1;

pht->ht[n + i].rchild = p2;

pht->ht[p1].parent = n + i;

pht->ht[p2].parent = n + i;

}//end for:n-1次合併

//設定root

pht->root = 2 * n - 2;

return pht;

}void huffmanencode(httreeptr pht, string input, htcodeptr htcode)

else//右孩子

}cout << htcode[i].leaf << ":" << &(htcode[i].code[htcode[i].start]) << "\n"; }}

void huffmandncode()

void countweight(string input, int weight, char cha)

else

continue;//若當前字元在之前已經統計過,則直接跳過

for (j = i; j < len; j++)

}cout << count << "次\n";

weight[k++] = count; }}

int main()

; httreeptr pht;

pht = createhuffmantree(input.length(), weight);

htcodeptr htcode;

htcode = new htcode[input.length()];

huffmanencode(pht, input, htcode);

system("pause");

return 0;

}

哈夫曼編碼 哈夫曼樹

1.定義 哈夫曼編碼主要用於資料壓縮。哈夫曼編碼是一種可變長編碼。該編碼將出現頻率高的字元,使用短編碼 將出現頻率低的字元,使用長編碼。變長編碼的主要問題是,必須實現非字首編碼,即在乙個字符集中,任何乙個字元的編碼都不是另乙個字元編碼的字首。如 0 10就是非字首編碼,而0 01不是非字首編碼。2....

哈夫曼樹 哈夫曼編碼

定義從a結點到b結點所經過的分支序列為從a結點到b結點的路徑 定義從a結點到b結點所進過的分支個數為從a結點到b結點的路徑長度 從二叉樹的根結點到二叉樹中所有結點的路徑長度紙盒為該二叉樹的路徑長度 huffman樹 帶權值路徑長度最小的擴充二叉樹應是權值大的外界點舉例根結點最近的擴充二叉樹,該樹即為...

哈夫曼編碼 哈夫曼樹

哈夫曼樹是乙個利用權值進行優化編碼的乙個比較奇怪的樹,他的實現比較簡單,用途也比較單一。哈夫曼樹的實現,實現要求 通過哈夫曼樹可以保證在編碼過程中不會出現例如 1000和100這樣的編碼規則,否則就會編碼失敗,因為1000和100在某些情況下的編碼會一模一樣。通過哈夫曼樹可以保證權值大的值進行編碼時...