KMP演算法概要

前言

經典空間換時間演算法看了賊久才看懂網上的部落格文章有很多但是基本都很複雜從頭到尾說一遍我是真的沒那精力和耐心因此這篇只說一下最核心的幾個問題

寫的更多是我的思考的過程希望能對大家有幫助

請結合jlu資料結構課本食用

kmp這三個老傢伙乙個比乙個頂

我們知道最簡單的字串匹配方法是暴力破解，即將模式串與主串從第一位開始匹配，若不成功則讓模式串從主串第二位開始匹配，一直到模式串末尾與主串末尾重合為止。

不用想也知道這種演算法雖然簡單但是極其耗時

為什麼？

因為在對失敗位置之前的n個字元進行匹配的過程中我們已經獲得了前n個字元的資訊而不對這些資訊進行判斷直接從初始位置的下一位開始匹配是對已知資訊的一種浪費

如何改進？

//舉個栗子主串： abaaabab（s）

模式串：abab（p）

這時我們已經知道p[0]=p[2] p[1]=p[3]

開始第一次匹配結果為 s[0]=p[0] s[1]=p[1] s[2]=p[2]s[3]!=p[3]

這時按照爆破演算法第二次應當逐一匹配

主串： abaaabab（s）

模式串： _abab（p）

即比較s[1]與p[0] s[2]與p[1] s[3]與p[2] s[4]與p[3]

而我們第一次匹配已經知道

s[1]=p[1] s[2]=p[2]

所以第二次匹配如果想要成功

起碼要滿足前提 p[1]=p[0] 且p[2]=p[1]

但是模式串p顯然不滿足這個條件所以第二次匹配可以直接跳過

這樣一來通過這次判斷我們將問題轉化到了p字串本身減少了s與p的比較次數從而降低了時間複雜度而如果我們多次進行這樣的判斷省去中間所有沒有意義的匹配過程那不就是對演算法進行了優化嗎？

假定p串長度為m

對於通常情況來說假設某一次匹配某次匹配後，stst+1…st+j與p0p1…pj匹配而st+j+1與pj+1不等，匹配失敗

通過之前的分析，我們知道此時要比較p本身如果p0…pj-1不等於p1…pj的話爆破演算法的下一步匹配就可以去掉

然後繼續對p串進行移位直到找到乙個k 使得p0…pk=pj-k…pj 這時才滿足了判斷的前提同時根據已經匹配上的部分可以知道

st+j-k…st+j=pj-k…pj=p0…pk也就是說p串的前k位已經可以匹配s串的對應位置了那麼只需要對p串中剩餘的其他位與s串後面的位置進行比較即可

即比較st+j+1…st+j+m-k與pk+1…pm是否相等

推廣一下kmp的思路即為匹配失敗後通過對模式串本身進行對比計算出模式串與主串已經匹配了的k位然後從模式串的下一位開始繼續進行下一次匹配

而在上面的過程中最核心的問題就是計算k的值 k值關係到匹配失敗後下一次匹配的回溯位置而課本上引入了失敗函式f(i); 其含義為從p[0]到p[i]的字串中字首和字尾的最長重複長度-1

//舉個栗子
p: abcab
f(i):-
1-1-
101

k值計算依然從一般情況來考慮，假定f(i)=k;

即在前 i 位之中的前k位與後k位相等

要求得f（i+1）

分情況討論

如果pk+1=pi+1 f(i+1)=k+1;

如果pk+1!=pj+1 說明由於第i+1位的加入使得 p串前 i+1 位中無法滿足前k+1位與最後k+1位相等因此我們需要尋找前i位中的另乙個滿足字首字尾相等的新字串並嘗試將該新串的後一位與p串的i+1相比較確定是否滿足條件必然有f(i+1)<=f(i) 而如何去找在前i+1位中滿足前j位與後j位相等的那個j呢？

我們將前i位命名為串a，前k為命名為串b 要求的前j位命名為c

由剛才的分析可知 j一定小於等於k 因此串c一定是串b的子串而c還滿足c與a的後j位相等而a的後k位又等於串b 所以c也與b的後j位相等

即p0…pj=pk-j…pk=pi-j…pi

又p0…pj=pk-j…pk 則f（k）=j

如果不能夠找到滿足條件的j 說明由於第i+1位的加入使得前i+1位中必不可能存在前後相等的子串如果能夠找到說明前i位中的前j位與後j位相等那麼此時需要再去判斷如果成功那麼便找到了j 因此可以得出f(i+1)=j+1=f(k)+1=f(f(i))+1=f2(i)+1

若串c仍不能滿足最後一位相等，則可再找出乙個新串d 此時可以推出f(i+1)=f3(i)+1

因此可以歸納為

若經過x次運算過程後找到了滿足條件的子串則

f(i+1)=fx(i)+1

若不存在滿足條件的子串則

f(i+1)=-1輸出結果：

第一行為失敗函式

第二行為匹配成功時的字串首位置

//舉個栗子
#include 
#include 
#include 
using namespace std; 
int match
(char mian[
100000
],char re[
100000
],int lenth1,int lenth2,int f[
100000])
else
else}}
if(i<
strlen
(re)
)else
return p;
}int main()
if(re[i]
==re[j+1]
)else
cout<<<
" ";
} cout
match
(mian,re,
strlen
(mian)
,strlen
(re)
,f);
cout
}

KMP演算法概要

資料結構 KMP演算法概要

kNN演算法概要

排序演算法概要

KMP演算法概要

資料結構 KMP演算法概要

kNN演算法概要

排序演算法概要

相關推薦