BZOJ4198 荷馬史詩 哈夫曼編碼

2022-03-27 02:51:23 字數 3088 閱讀 2245

time limit: 10 sec  memory limit: 512 mb

追逐影子的人,自己就是影子。 ——荷馬

allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的《荷馬史詩》。但是由《奧德賽》和《伊利亞特》組成的鴻篇巨制《荷馬史詩》實在是太長了,allison 想通過一種編碼方式使得它變得短一些。

一部《荷馬史詩》中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。allison 想要用 k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:

對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。

現在 allison 想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。在確保總長度最小的情況下,allison 還想知道最長的 si 的最短長度是多少?

乙個字串被稱為 k 進製字串,當且僅當它的每個字元是 0 到 k−1 之間(包括 0 和 k−1)的整數。

字串 str1 被稱為字串 str2 的字首,當且僅當:存在 1≤t≤m,使得 str1=str2[1..t]。其中,m 是字串 str2 的長度,str2[1..t] 表示 str2 的前 t 個字元組成的字串。

輸入檔案的第 1 行包含 2 個正整數 n,k,中間用單個空格隔開,表示共有 n 種單詞,需要使用 k 進製字串進行替換。

接下來 n 行,第 i+1 行包含 1 個非負整數 wi,表示第 i 種單詞的出現次數。

輸出檔案包括 2 行。

第 1 行輸出 1 個整數,為《荷馬史詩》經過重新編碼以後的最短長度。

第 2 行輸出 1 個整數,為保證最短總長度的情況下,最長字串 si 的最短長度。

4 2112

2122用 x(k) 表示 x 是以 k 進製表示的字串。

一種最優方案:令 00(2) 替換第 1 種單詞,01(2) 替換第 2 種單詞,10(2) 替換第 3 種單詞,11(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:

1×2+1×2+2×2+2×2=12

最長字串 si 的長度為 2。

一種非最優方案:令 000(2) 替換第 1 種單詞,001(2) 替換第 2 種單詞,01(2) 替換第 3 種單詞,1(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:

1×3+1×3+2×2+2×1=12

最長字串 si 的長度為 3。與最優方案相比,文章的長度相同,但是最長字串的長度更長一些。

對於所有資料,保證 2≤n≤100000,2≤k≤9。

選手請注意使用 64 位整數進行輸入輸出、儲存和計算。

題解:似乎這道題是純粹的要求掌握知識點。。。

如果學過哈夫曼樹的話,這就接近一道板子題了。

我們先來科普下哈夫曼樹:

如果我們設點到根節點的邊數×點權為點的帶權路徑長度,一顆樹中每個節點的帶權路徑長度和為樹的帶權路徑長度,

給定n個權值作為n個葉子結點,構造一棵二叉樹,若樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優二叉樹,也稱為哈夫曼樹。

也就是說,哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。

在構造哈夫曼樹時,我們只需要取出權值最小的兩個點,把他們合併起來,權值和作為新的節點的權值,

在最後只剩下乙個節點時我們就得到了這些節點對應的哈夫曼樹。

哈夫曼樹最重要的功能就是字首編碼了!

我們給每個單詞(或者字母)編碼的時候,為了使總長度短一些,可以考慮給每個單詞/字母不等長編碼。

也就是說,單詞中使用頻率高的用短碼,使用頻率低的用長碼,從而優化總長度。

當然,這些編碼也不能引起誤會,也就是說,不能出現某個串是其他某個串的字首。

那麼這時候,我們可將每個單詞的出現頻數作為單詞結點的權值賦予該結點上,

顯然單詞使用次數越小權值越小,權值越小葉子就越靠下,於是頻率小,到根節點距離就長,編碼也就長,同理次數大編碼短,

這樣就保證了此樹的最小帶權路徑長度效果上就是文章的最短長度。

我們再看這道題:

allison 想要用 k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:

對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。

現在 allison 想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。

顯然,這裡我們就要用哈夫曼樹做乙個編碼即可,但是本題是用k進製編碼:

那麼我們只需要把哈夫曼樹由二叉樹變成k叉樹----但是可能節點個數不夠。

我們考慮,一顆滿的k叉哈夫曼樹,節點數可以表示為n*k*(k-1)+1----也就是說,如果n%((k-1)*k)!=1

,我們可以補上幾個權值為0的節點,補到n*k*(k-1)+1個,這樣他們並不會對我們的建樹以及計算產生任何影響(權值為0,計數時也不會計入長度)

最後我們只要輸出整棵樹的帶權路徑長度,以及這棵樹中最深的節點深度-1就行了!

**見下:

1 #include 2 #include 3 #include 4 #include 5

using

namespace

std;

6 typedef long

long

ll;7

const

int n=100010;8

int n,k,maxdeep[n<<7

];9 ll sum[n<<7],w[n<<7

];10

struct

point

1114 inline bool

operator

< (const point &b)const

15

16 inline bool

operator > (const point &b)const

17

18};

19 priority_queue, greater>q;

20int

main()

2135 printf("

%lld\n%d

",sum[q.top().id],maxdeep[q.top().id]-1

);36 }

bzoj4198 哈夫曼樹 荷馬史詩

description 追逐影子的人,自己就是影子。荷馬 allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的 荷馬史詩 但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,allison 想通過一種編碼方式使得它變得短一些。一部 ...

BZOJ4198荷馬史詩

time limit 10 sec memory limit 512 mb submit 240 solved 134 submit status discuss 追逐影子的人,自己就是影子。荷馬 allison 最近迷上了文學。她喜歡在乙個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的...

k叉哈夫曼樹 bzoj 4198荷馬史詩

k叉哈夫曼樹在acm中的最常用的應用就是求合併n個數最小的代價。哈夫曼樹也可以是k叉的,只是在構造k叉哈夫曼樹時需要先進行一些調整。構造哈夫曼樹的思想是每次選k個權重最小的元素來合成乙個新的元素,該元素權重為k個元素權重之和。但是當k大於2時,按照這個步驟做下去可能到最後剩下的元素少於k個。解決這個...