字串雜湊

2021-10-02 12:21:49 字數 1570 閱讀 7404

雜湊就是乙個類似於函式的東西,將乙個值轉換成另外的乙個值,得到的值通常會比原來的值小一些或者好比較一些。那麼字串雜湊就是將一串字串轉換成乙個整數的函式。

我們假設有乙個字串s=s1s2s3s4…sn。

雜湊公式

unsigned

long

long hash[n]

hash[i]

=(hash[i−1

])∗p+

idx(s[i]

)%mod

這裡的idx(s[i])=s[i]-『a』+1;

對於雜湊公式中的p指的是乙個進製數也是素數,mod通常也為乙個素數,這樣做的原因是盡量不讓產生的兩個數重複,這是單模,還是有一定的重複概率,但是還有一種雙模,產生重複的概率基本上為0.

還有mod的數一般取unsighed long long int 即2^64-1,這樣系統會自動幫我們模,就不用我們去操心了。

下面來看個例題研究一下字串雜湊的作用

兔子與兔子

很久很久以前,森林裡住著一群兔子。

有一天,兔子們想要研究自己的 dna 序列。

我們首先選取乙個好長好長的 dna 序列(小兔子是外星生物,dna 序列可能包含 26 個小寫英文本母)。

然後我們每次選擇兩個區間,詢問如果用兩個區間裡的 dna 序列分別生產出來兩隻兔子,這兩個兔子是否一模一樣。

注意兩個兔子一模一樣只可能是他們的 dna 序列一模一樣。

輸入格式

第一行輸入乙個 dna 字串 s。

第二行乙個數字 m,表示 m 次詢問。

接下來 m 行,每行四個數字 l1,r1,l2,r2,分別表示此次詢問的兩個區間,注意字串的位置從1開始編號。

輸出格式

對於每次詢問,輸出一行表示結果。

如果兩隻兔子完全相同輸出 yes,否則輸出 no(注意大小寫)。

資料範圍

1≤length(s),m≤1000000

輸入樣例:

aabbaabb

31 3 5 7

1 3 6 8

1 2 1 2

輸出樣例:

yesno

yes分析:我們可以用字串雜湊將字串進行轉換之後,就可以方便的找出是否相等。

#include

#define hash 131

//這裡的hash值取乙個素數,還可以為13331之類的

unsigned

long

long

int hash[

1000000+10

];unsigned

long

long

int p[

1000000+10

];//進製數

char s[

1000000+10

];intmain()

int m;

scanf

("%d"

,&m)

;while

(m--)}

}

通常這種字串匹配我們用的是kmp演算法,但是在這種主串中找字串我們就可以用到字串雜湊的方法也能水出來。

字串雜湊

參照演算法筆記p109,甲級1039 先假設字串均由大寫字母a z構成。在這個基礎上,不妨把a z視為0 25,這樣就把26個大寫字母對應到了26進製中。接著,按照將26進製轉化為10進製的思路,由進製的轉換結論可知,在進製轉換過程中,得到的10進製肯定是唯一的,由此便可實現將字串對映為整數的需求 ...

字串雜湊

昨天做了一道字串雜湊的題,感覺還好理解。今天的題看了 不知道為什麼,搜來搜去發現不知道的東西還很多,網上找到的東西也都是很零散,書上也沒有系統的講解。先自己整理一下這些零散的知識 關於字串涉及到的演算法大概有 hash kmp trie ac自動機等等,現在還都不明白是怎麼回事,這次先研究字串has...

字串雜湊

給定乙個長度為n的字串,再給定m個詢問,每個詢問包含四個整數l1,r1,l2,r2,請你判斷 l1,r1 和 l2,r2 這兩個區間所包含的字串子串是否完全相同。字串中只包含大小寫英文本母和數字。輸入格式 第一行包含整數n和m,表示字串長度和詢問次數。第二行包含乙個長度為n的字串,字串中只包含大小寫...