Trie樹計算單詞字首的個數

2021-06-28 12:58:42 字數 2275 閱讀 5948

時間限制:

10000ms

單點時限:

1000ms

記憶體限制:

256mb

小hi和小ho是一對好朋友,出生在資訊化社會的他們對程式設計產生了莫大的興趣,他們約定好互相幫助,在程式設計的學習道路上一同前進。

這一天,他們遇到了一本詞典,於是小hi就向小ho提出了那個經典的問題:「小ho,你能不能對於每乙個我給出的字串,都在這個詞典裡面找到以這個字串開頭的所有單詞呢?」

身經百戰的小ho答道:「怎麼會不能呢!你每給我乙個字串,我就依次遍歷詞典裡的所有單詞,檢查你給我的字串是不是這個單詞的字首不就是了?」

小hi笑道:「你啊,還是太年輕了!~假設這本詞典裡有10萬個單詞,我詢問你一萬次,你得要算到哪年哪月去?」

小ho低頭算了一算,看著那一堆堆的0,頓時感覺自己這輩子都要花在上面了...

小hi看著小ho的囧樣,也是繼續笑道:「讓我來提高一下你的知識水平吧~你知道樹這樣一種資料結構麼?」

小ho想了想,說道:「知道~它是一種基礎的資料結構,就像這裡說的一樣!」

小hi滿意的點了點頭,說道:「那你知道我怎麼樣用一棵樹來表示整個詞典麼?」

小ho搖搖頭表示自己不清楚。

提示一:trie樹的建立

「你看,我們現在得到了這樣一棵樹,那麼你看,如果我給你乙個字串ap,你要怎麼找到所有以ap開頭的單詞呢?」小hi又開始考校小ho。

「唔...乙個個遍歷所有的單詞?」小ho還是不忘自己最開始提出來的演算法。

「笨!這棵樹難道就白構建了!」小hi教訓完小ho,繼續道:「看好了!」

提示二:如何使用trie樹

提示三:在建立trie樹時同時進行統計!

「那麼現在!趕緊去用**實現吧!」小hi如是說道

輸入的第一行為乙個正整數n,表示詞典的大小,其後n行,每一行乙個單詞(不保證是英文單詞,也有可能是火星文單詞哦),單詞由不超過10個的小寫英文本母組成,可能存在相同的單詞,此時應將其視作不同的單詞。接下來的一行為乙個正整數m,表示小hi詢問的次數,其後m行,每一行乙個字串,該字串由不超過10個的小寫英文本母組成,表示小hi的乙個詢問。

在20%的資料中n, m<=10,詞典的字母表大小<=2.

在60%的資料中n, m<=1000,詞典的字母表大小<=5.

在100%的資料中n, m<=100000,詞典的字母表大小<=26.

本題按通過的資料量排名哦~

對於小hi的每乙個詢問,輸出乙個整數ans,表示詞典中以小hi給出的字串為字首的單詞的個數。

樣例輸入

5

babaab

babbbaaaa

abba

aaaaabaa

babaababb

5babb

baabaaa

babbb

bbabbaab

樣例輸出

103

0

這是一道hiho上的題目,主要方法是trie樹,俗稱字典樹,是一種高效儲存海量單詞的結構,通過trie可以很快地查詢自己想要找的單詞是否在單詞集合中,或者如本題中的含有某相同字首的單詞個數。此處的字首指的是單詞「abc」,那麼"a","ab","abc"都是它的字首。

trie樹的建立有兩種方法,一種是鍊錶的形式,一種是雙陣列形式,前者理解起來相對簡單,但是空間占用較大,後者是理解起來複雜,暫時還沒有搞懂,網上都是在說有限自動機的,後面會進一步搞懂他。

trie樹每個節點表示乙個字母,且有26個子節點。原理很簡單:樹的每一層都對應字串的乙個位置。

此題一開始的思路有問題,應該集中思考問題——包含字首的單詞個數。如果仔細想得話,會發現trie樹在建立的時候,在所輸入的所有單詞中單詞字首重複的部分會被遍歷很多次,所以如果用乙個資料記錄遍歷的次數,就能知道結果。所以,「abc」中的c對應的遍歷次數,就是以它為字首的所有單詞的個數。

#include#includeclass trienode

}public:

int flag;

trienode *parry[26];

};void insert(char tar, int len, trienode *root)

return ;

}int find(char tar, int len, trienode *root)

return root->flag;

}int main()

{ int n,m;

trienode *root=new trienode;

char input[11];

scanf("%d",&n);

for(int i=0;i

trie樹 dp 字首單詞

讓我們一起來 forever shi神犇 題意 給你n個字串,每次選出若干個字串形成乙個集合,問有多少個集合滿足集合中的任何乙個字串都不是另外乙個字串的字首。空集也一定是滿足條件的。保證不會出現兩個相同的字串。首先對所有字串建出一棵tri etrie trie 樹,然後我們可以發現其實tri etr...

字首樹(字典樹,單詞查詢樹,Trie樹)

參考 概述 字首樹又名字典樹,單詞查詢樹,trie樹,是一種多路樹形結構,是雜湊樹的變種,和hash效率有一拼,是一種用於快速檢索的多叉樹結構。典型應用是用於統計和排序大量的字串 但不僅限於字串 所以經常被搜尋引擎系統用於文字詞頻統計。它的優點是 最大限度地減少無謂的字串比較,查詢效率比雜湊表高。t...

Trie 字首樹 字典樹 單詞查詢樹(資料結構)

在寫完了kmp演算法的部落格之後,我下定決心,一定要寫出一篇關於 ac自動機的部落格 ac自動機實際上就是字典樹上的kmp演算法。所以,考慮到廣大同學不一定會寫trie樹,特此在此處寫了一篇文章介紹介紹這種資料結構。字典樹 又稱單詞查詢樹,trie樹,是一種樹形結構,是一種雜湊樹的變種。典型應用是用...