字串雜湊

2021-10-02 12:11:00 字數 2027 閱讀 6181

hash:

1.簡單介紹

就是把任意長度的輸入(又叫做對映),通過hash演算法,變換成固定長度的輸出,該輸出就是hash值。

通常運用在查詢字串中,通常的方法會乙個乙個的匹配字串,這樣的時間複雜度為o(n),而hash演算法能將這個字串對映為乙個整數,就是雜湊值。如果雜湊值一樣說明這個字串一樣,時間複雜度為o(1)。

2.hash公式:

n=100010;

base=131或者1331(乙個經驗值,當為131或1331時不容易出現重複值)。

unsigned long long h[n],p[n];(用unsigned long long相當於自動對2^64取模,所以不用擔心溢位。

h[i]=h[i-1]*base+s[i]-'a'+1;

p[i]=p[i-1]*base;

例如:

}除此之外,hash演算法能夠知道字串的每乙個字首的雜湊值,還能計算某乙個子串(某一段字串)的雜湊值。

3.例題:

輸入格式

第一行輸入乙個 dna 字串 s。

第二行乙個數字 m,表示 m 次詢問。

接下來 m 行,每行四個數字 l1,r1,l2,r2l1,r1,l2,r2,分別表示此次詢問的兩個區間,注意字串的位置從1開始編號。

輸出格式

對於每次詢問,輸出一行表示結果。

如果兩隻兔子完全相同輸出 yes,否則輸出 no(注意大小寫)。

資料範圍

1≤length(s),m≤10000001≤length(s),m≤1000000

輸入樣例:

aabbaabb

31 3 5 7

1 3 6 8

1 2 1 2

輸出樣例:

yes

noyes

**:

#include#includeint base=131;

char s[1000010];

unsigned long long h[1000010],p[1000010];

int main()

scanf("%d",&m);

while(m--)

return 0;

}

4.心得:

通過對hash演算法的學習,了解到查詢字串在kmp演算法和bf演算法之外,時間複雜度更小o(1)的雜湊演算法。

而且能夠查詢所有字首和任意子串。

字串雜湊

參照演算法筆記p109,甲級1039 先假設字串均由大寫字母a z構成。在這個基礎上,不妨把a z視為0 25,這樣就把26個大寫字母對應到了26進製中。接著,按照將26進製轉化為10進製的思路,由進製的轉換結論可知,在進製轉換過程中,得到的10進製肯定是唯一的,由此便可實現將字串對映為整數的需求 ...

字串雜湊

昨天做了一道字串雜湊的題,感覺還好理解。今天的題看了 不知道為什麼,搜來搜去發現不知道的東西還很多,網上找到的東西也都是很零散,書上也沒有系統的講解。先自己整理一下這些零散的知識 關於字串涉及到的演算法大概有 hash kmp trie ac自動機等等,現在還都不明白是怎麼回事,這次先研究字串has...

字串雜湊

給定乙個長度為n的字串,再給定m個詢問,每個詢問包含四個整數l1,r1,l2,r2,請你判斷 l1,r1 和 l2,r2 這兩個區間所包含的字串子串是否完全相同。字串中只包含大小寫英文本母和數字。輸入格式 第一行包含整數n和m,表示字串長度和詢問次數。第二行包含乙個長度為n的字串,字串中只包含大小寫...