針對特定應用的字典壓縮演算法

2021-08-23 15:55:17 字數 372 閱讀 3366

要使用字典壓縮演算法,必須找到乙個好的壓縮字典。這個字典中的詞在原始資料中出現的次數要足夠多。出現的愈多的詞,壓縮比應該越大。

使用字典壓縮實現起來比較簡單,效率也比較高。但是乙個問題是,當壓縮和解壓縮不是在同乙個地方的時候,很難保證同時更新。當不能保證同時更新的時候就對壓縮字典的穩定性就有更高的要求。也就是說,不管針對什麼原始資料,壓縮比的波動幅度不要太大。

使用了分級的壓縮字典。統計得到了三個壓縮字典,字典的詞數目逐漸增加,能壓縮的位元組數卻是逐漸減少。類似於3級cache的原理,在第乙個字典中出現的詞的概率大,但是字典的詞比較少;在第3個字典中出現的詞的概率最小,但是字典中詞的個數最大。

我使用的字典壓縮演算法,是對乙個特定的資料做的,其資料都是字母和數字,所以壓縮效果還比較好。

字典樹的應用

論吹牛,學弟一點也不輸個學長。為了找到自己的存在感,學弟又和學長在比誰前女友多,於是2個人撕逼開始了,學弟說我在大一的時候談了a個女朋友,學長說那是我乙個星期的 數量,我大一的時候談了ab個女朋友,學弟又說加上高中的我談了abc個女友,學長再次 不服,加上高中我談了abcdf個女朋友 想必大家已經明...

字典樹的應用

又稱單詞查詢樹,trie樹 是一種 樹形結構 是一種雜湊樹的變種。典型應用是用於統計,排序和儲存大量的字串 但不僅限於字串 所以經常被搜尋引擎系統用於文字詞頻統計。它的優點是 利用字串的公共字首來減少查詢時間,最大限度地減少無謂的字串比較,查詢效率比 雜湊表高。定義 1 typedef struct...

系統字典的應用

1.首先在系統字典中進行註冊,系統會生成父級編碼,如圖 複製父級編碼 例如 1301 在constant類中 寫上如下 public static final string opinion type 1301 意見類別2.在controller類中的寫上如下 mapopiniontypemap co...