KMP 個人理解總結

這幾天複習kmp演算法，發現自己看別人的講解又看糊塗了，所以還是需要將別人的思想理解之後，自己再輸出一邊。

kmp的出現是為了優化樸素模式匹配演算法，那麼樸素模式匹配演算法是什麼？又存在什麼缺點呢？

樸素模式匹配演算法：複雜度o(n*m)，就是將主串中與模式串長度相同的子串提取出來，挨個和模式串對比，當子串與模式串某個對應字元不匹配時，就立即放棄當前子串，檢索下乙個子串。

/* 字串下標始於0 */
int*****stringsearch
(string s, string p)
else
//不相等}if
(j == p_len)
//匹配成功
return i - j;
return-1
;}

這裡面就存在乙個問題，就是每次遇到不匹配時，主串和模式串都要回溯，即**中的i = i - j + 1和j = 0。這樣是非常不划算的，因為你已經知道前面的字元是哪些了（你已經掃瞄過一遍了），它和模式串有沒有可能匹配你也是知道的，所以再回去重新掃一遍浪費時間。

於是就誕生了kmp演算法，它的優化思路是：不回溯主串，只回溯模式串。也就是說當主串和模式串不匹配的時候，我就把模式串的指標j指向模式串中可能和當前主串字元相匹配的位置，讓他們繼續比較。這個可能和主串字元匹配的位置構成的新陣列就是next陣列。

例如，如圖1所示，當匹配到ｄ時，發現匹配不上了，樸素模式匹配演算法會讓主串和模式串都回溯（子串和模式串都回到首字元處），再重新開始比較。

而這是沒必要的，因為你已經知道ｉ前面的字元是abcdab，那麼模式串中可能和當前主串ｉ字元＇　＇相匹配的位置是ｃ，因為主串abcdab中的最後兩個字元ab和模式串abcdab中的最開頭兩個字元ab匹配，那麼我直接讓模式串的指標ｊ回到ｃ的地方，讓ｃ和＇　＇比較就行。

next陣列存放的是回溯的下乙個需要比較的位置，即這個位置之前的字元都已經是匹配的了。

next[i]等於p[0]…p[i - 1]最長的相同真前字尾的長度。由於字串是從0開始的，所以這個長度所在位置就是匹配字串的下一位，也就是回溯的下乙個需要比較的位置。

/* p 為模式串，下標從 0 開始 */
void
getnext
(string p,
int next)
else
j = next[j];}
}

其中的關鍵部分在於next[i]=j和j=next[j]。

可以這樣理解：

#include
#include
using
namespace std;
/* p為模式串，下標從0開始 */
void
getnext
(string p,
int next)
else
j = next[j];}
}/* 在s中找到p第一次出現的位置 */
intkmp
(string s, string p,
int next)
else
j = next[j]
;//當前字元匹配失敗，進行跳轉}if
(j == p_len)
//匹配成功
return i - j;
return-1
;}intmain()
; cout <<
kmp(
"bbc abcdab abcdabcdabde"
,"abcdabd"
, next)
<< endl;
//15
return0;
}

KMP 個人理解總結

KMP演算法個人理解總結

KMP 演算法（個人理解）

KMP演算法的個人理解

KMP 個人理解總結

KMP演算法個人理解總結

KMP 演算法（個人理解）

KMP演算法的個人理解

相關推薦