AcWing 149 荷馬史詩(哈夫曼樹 貪心)

2021-09-26 00:02:50 字數 1736 閱讀 9473

但是由《奧德賽》和《伊利亞特》組成的鴻篇巨制《荷馬史詩》實在是太長了,達達想通過一種編碼方式使得它變得短一些。

一部《荷馬史詩》中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。

達達想要用k 進製串 si 來替換第 i 種單詞,使得其滿足如下要求:

對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首。

現在達達想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。

在確保總長度最小的情況下,達達還想知道最長的 si 的最短長度是多少?

乙個字串被稱為 k 進製字串,當且僅當它的每個字元是 0 到 k−1 之間(包括 0 和 k−1)的整數。

字串 str1 被稱為字串 str2 的字首,當且僅當:存在 1≤t≤m,使得 str1=str2[1…t]。

其中,m 是字串 str2 的長度,str2[1…t] 表示 str2 的前 t 個字元組成的字串。

輸入檔案的第 1 行包含 2 個正整數 n,k,中間用單個空格隔開,表示共有 n 種單詞,需要使用 k 進製字串進行替換。

第2~n+1 行:第 i+1 行包含 1 個非負整數 wi,表示第 i 種單詞的出現次數。

輸出檔案包括 2 行。

第 1 行輸出 1 個整數,為《荷馬史詩》經過重新編碼以後的最短長度。

第 2 行輸出 1 個整數,為保證最短總長度的情況下,最長字串 si 的最短長度。

2≤n≤100000

2≤k≤9

題目巨長,總結一下就是我們要將《荷馬史詩》中的單詞重新編碼,已知單詞種類數和出現的次數(因為要重新編碼所以不在意原長度),將每乙個單詞重新編碼成乙個k進製數,然後求編碼後最短長度,這就類似huffman編碼。

因為是k進製數,所以每一位上最多編碼k個單詞(例如3進製可以用0、1、2表示),這樣就是個k叉huffman樹(即一次合併k個值),又因為存在n%k!=0的情況,這種會導致最下層合併的節點多,上層合併的節點少而導致和增大,所以我們可以進行補零操作。

然後考慮最長字串的最短長度,因為用了huffman樹,所以我們的最長字串一般是最小的,但由於存在權值相同的點深度不同的情況,所以在這種情況下優先合併深度低的點。

#include

#include

#include

#include

#include

#include

#define ll long long

using

namespace std;

pairint>t;

priority_queueint>

,vectorint>

>

,greaterint>

>

>q;

ll ans=

0,x;

intmain()

);}while

((n-1)

%(k-1)

) q.

push()

,n++

;while

(q.size()

>1)

ans+

=sum;

//printf("%lld\n",ans);

q.push()

;}printf

("%lld\n%d\n"

,ans,q.

top(

).second)

;return0;

}

ACWING149 荷馬史詩(多叉哈夫曼樹)

追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。達達想要用 k 進製串 si ...

Acwing 149 荷馬史詩 K叉堆

追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。達達想要用 k 進製串 si ...

荷馬史詩 k叉哈夫曼樹

題目描述 追逐影子的人,自己就是影子。荷馬 達達最近迷上了文學。但是由 奧德賽 和 伊利亞特 組成的鴻篇巨制 荷馬史詩 實在是太長了,達達想通過一種編碼方式使得它變得短一些。一部 荷馬史詩 中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wiwi。達達想要用 k ...