字串查詢演算法kmp

字串查詢最簡單的方法就是乙個乙個地「滑動」查詢。這樣查詢演算法複雜度可定很高，假設pattern的長度為m,文字txt的長度為n，那麼演算法複雜度為o(m(n-m-1))。

kmp模式搜尋演算法

kmp(knuth morris pratt)我只認識knuth，大名鼎鼎的高納德老頭子嘛。

kmp演算法的基本思想是，當「失配」的時候，利用之前已經比較過的字串資訊，確定重新開始比較時pattern串的開始的位置，而不是每次都要從頭開始比較。

kmp演算法先預處理一下pattern串pat，構造出來乙個lps陣列，lps的意思是longest proper prefix which is also suffix（最長字首也是最長字尾）。對於字串pat[0...i]，i取值可以是0到m,m是pat的長度。lps[i]儲存的值是子模式串pat[0...i]的最大字首字尾的長度。

lps[i] = the longest proper prefix of pat[0..i] 
which is also a suffix of pat[0..i].

examples:

for the pattern 「aabaacaabaa」, lps is [0, 1, 0, 1, 2, 0, 1, 2, 3, 4, 5]

for the pattern 「abcde」, lps is [0, 0, 0, 0, 0]

for the pattern 「aaaaa」, lps is [0, 1, 2, 3, 4]

for the pattern 「aaabaaa」, lps is [0, 1, 2, 0, 1, 2, 3]

for the pattern 「aaacaaaaac」, lps is [0, 1, 2, 0, 1, 2, 3, 3, 3, 4]

搜尋演算法:

不像簡單搜尋方法那樣乙個字元乙個字元的滑動搜尋，我們用lps確定pattern串滑動的位置。下面詳細說明具體怎麼比較：當pat[i]和txt[i]失配的時候，pat[0...j-1]和txt[i-j+1...i-1]是匹配的。如果滑動一位去再次比較，那麼這pat[0...j-1]個字元肯定不匹配了。那麼應該滑動多少位呢？這是就用到lps了，這是滑動lps[j-1]位.

預處理演算法:

#include #include #include // ***** search

void search(char* txt,char* pat)

{ int n=strlen(txt);

int m=strlen(pat);

for(int i=0;i

字串查詢演算法kmp

字串查詢演算法kmp

字串查詢KMP演算法

KMP 演算法字串查詢演算法

字串查詢演算法kmp

字串查詢演算法kmp

字串查詢KMP演算法

KMP 演算法 字串查詢演算法

相關推薦

KMP 演算法字串查詢演算法