hiho兄弟的字典樹之爭(hiho1014)

2022-07-23 06:15:13 字數 3530 閱讀 5347

小hi和小ho是一對好朋友,出生在資訊化社會的他們對程式設計產生了莫大的興趣,他們約定好互相幫助,在程式設計的學習道路上一同前進。

這一天,他們遇到了一本詞典,於是小hi就向小ho提出了那個經典的問題:「小ho,你能不能對於每乙個我給出的字串,都在這個詞典裡面找到以這個字串開頭的所有單詞呢?

身經百戰的小ho答道:「怎麼會不能呢!你每給我乙個字串,我就依次遍歷詞典裡的所有單詞,檢查你給我的字串是不是這個單詞的字首不就是了?

小hi笑道:「你啊,還是太年輕了!~假設這本詞典裡有10萬個單詞,我詢問你一萬次,你得要算到哪年哪月去?」

小ho低頭算了一算,看著那一堆堆的0,頓時感覺自己這輩子都要花在上面了...

小hi看著小ho的囧樣,也是繼續笑道:「讓我來提高一下你的知識水平吧~你知道樹這樣一種資料結構麼?」

小ho想了想,說道:「知道~它是一種基礎的資料結構,就像這裡說的一樣!」

小hi滿意的點了點頭,說道:「那你知道我怎麼樣用一棵樹來表示整個詞典麼?」

小ho搖搖頭表示自己不清楚。

提示一:trie樹的建立:

小hi於是在紙上畫了一會,遞給小ho,道:「你看這棵樹和這個詞典有什麼關係?」

小ho盯著手裡的紙想了一會道:「我知道了!對於從樹的根節點走到每乙個黑色節點所經過的路徑,如果將路徑上的字母都連起來的話,就都對應著詞典中的乙個單詞呢!

小hi說道:「那你知道如何根據乙個詞典構建這樣一棵樹麼?」

「不造!」

「想你也不知道,我來告訴你吧~」小hi擺出一副老師的樣子,說道:「你先這麼想,如果我已經有了這樣的乙個詞典和對應的一棵樹,我要新增乙個新的單詞apart,我應該怎麼做?」

「讓我想想……」小ho又開始苦思冥想:「首先我要先看看已經能走到哪一步了對吧?比如我從1號節點走"a"這一條邊就可以走到2號節點,然後從2號節點走"p"這一條邊可以走到3號節點,然後……就沒路可走了!這時候我就需要新增一條從3號節點出發且標記為"p"的邊才可以接著往下走……最後就是這樣了!然後我把最後到達的這個結點標記為黑色就可以了。」

小hi說道:「真聰明~那你不妨再算算如果是乙個有10w個單詞的詞典,每個單詞的長度不超過10的話,這棵樹會有多大?」

小ho於是掏出筆來,一邊畫一遍念叨:「假設我已經將前三個單詞構成了這樣一棵樹,那麼我要新增乙個新的單詞的時候,最壞情況是這個單詞和之前的三個單詞都沒有公共字首,那麼這個新的單詞的長度如果是5的話,我就至少要新增5個結點到樹中才能夠繼續表示這個詞典!」

「而如果每次都是最壞情況的話,這棵樹最多也就100w個結點這麼大!更何況最壞情況是不可能次次都發生的!畢竟字母表也才26個字母呢!」小ho繼續說道。

「嗯~這樣我們是不是就可以用(單詞個數*單詞長度)個結點來表示乙個詞典了呢?小hi問道。

「是的呢!」小ho道:「但是這樣一棵樹又有什麼用呢?」

「可別小看了它,它就是傳說中的trie樹哦~至於他有什麼用,一會你就知道了!」小hi笑嘻嘻的回答道。

提示二:如何使用trie樹:

小hi在樹上用綠色標出了乙個節點,遞給小ho。

「這個結點……是從根節點先走"a"然後走"p"到達的結點呢!哦~~我知道了,以這個結點為根的子樹裡所有標記結點都是以"ap"為字首的單詞呢!而且所有以"ap"為字首的單詞都在以這個節點為根的子樹裡~」小ho驚喜道。

「是的呢~那你對怎麼解決我的問題有想法了麼?」小hi追問道。

「唔...那就是每次拿到你的字串之後,我在樹上找到其對應的那個結點,然後統計這個節點中有多少個標記節點?」小ho不是很確定的答道:「但是這樣...似乎在最壞情況,也就是你每次給個字串都很短的時候,我還是要掃瞄這棵樹的很大一部分呢?也就是說雖然平均時間複雜度降低了,但是最壞情況時間複雜度還是很高的樣子!」

小hi笑嘻嘻道:」沒想到你自己看出來了呢~我還以為又要教訓你了!~那你有什麼好的解決方法麼?」

「沒呢!小hi你就別賣關子了,趕緊告訴我吧!」被折磨的夠嗆的小ho開始求饒。

「好吧!就幫你這一回~」

提示三:在建立trie樹時同時進行統計!

「小ho你有沒有想過這樣乙個問題?不妨稱以t為根的子樹中標記節點的個數為l[t],既然我要統計某個l[t1],,而這個結點是不確定的,我有沒有辦法一次性把所有結點的l[t]求出來呢?」小hi整理了下思緒,問道。

「似乎是有的,老師以前說過,遞迴什麼的。。」小ho答道。

「遞迴太複雜了!我們可以之後再說,你這麼想,在你構建trie樹的時候,當你經過乙個結點的時候,說明了什麼?」小hi撇了撇頭,繼續問道。

「我想想,經過乙個結點……標記結點……說明了以這個結點為根的子樹中將要多出來乙個標記結點?」

「沒錯!那你有沒有什麼辦法來記錄這個改變呢?」

「我想想,我在最開始置所有l[t]=0,然後每次新增乙個新的單詞的時候,都將它經過的所有結點的l[t]全部+1,這樣我構建完這棵trie樹的時候,我也就能夠同時統計到所有l[t]了,對麼?」小ho開心道。

input

輸入的第一行為乙個正整數n,表示詞典的大小,其後n行,每一行乙個單詞(不保證是英文單詞,也有可能是火星文單詞哦),單詞由不超過10個的小寫英文本母組成,可能存在相同的單詞,此時應將其視作不同的單詞。接下來的一行為乙個正整數m,表示小hi詢問的次數,其後m行,每一行乙個字串,該字串由不超過10個的小寫英文本母組成,表示小hi的乙個詢問。

在20%的資料中n, m<=10,詞典的字母表大小<=2.

在60%的資料中n, m<=1000,詞典的字母表大小<=5.

在100%的資料中n, m<=100000,詞典的字母表大小<=26.

本題按通過的資料量排名哦~

output

對於小hi的每乙個詢問,輸出乙個整數ans,表示詞典中以小hi給出的字串為字首的單詞的個數。

sample input

5

babaab

babbbaaaa

abba

aaaaabaa

babaababb

5babb

baabaaa

babbb

bbabbaab

sample output

103

00

1 #include2 #include

3 #include//可改為#include

4using

namespace

std;

5int wum[100000*26][26];6

int num[100000*26];7

int cnt = 1;8

void insert(char *str)

920 num[root]++;21}

22int search(char *str)

2334

return

num[root];35}

36int

main()

3746 scanf("

%d",&m);

47for(int j=1;j<=m;j++)

4852

return0;

53 }

左孩子右兄弟的字典樹

一般寫的字典樹都是雙陣列的形式,但是當字元的數量很多時,就會占用大量的記憶體,初始化操作也會變慢。這時,就可以用左孩子右兄弟的寫法,來以時間換空間。下面是自己寫的乙個 1 include 2 include 3 include 4 5using namespace std 67 const int ...

簡單的字典樹實現 hiho一下第二週

hiho一下第二週 題目1 trie樹 題目要求先建立字典樹,然後實現查詢擁有指定字串字首的所有單詞的數量。建立了一顆26叉樹,每個子節點代表乙個字母,在樹的生成過程同時進行統計,加快查詢速度。1.樹節點類 class trienode 2.樹類 class trie void insert str...

hiho 11 樹的最長路徑

樹中兩個結點之間的最長距離,距離指兩個節點之間的邊數。首先選擇乙個點作為樹的根節點,對於以t為根的子樹,l1和l2表示從t到葉子節點的最長距離和次長距離,那麼子樹對應的結果是 l1 l2 樹在儲存時,可以按照無向邊儲存,在dfs訪問時,傳入父節點的指標,遍歷時,如果是父節點就跳過。include i...