擴充套件 KMP

**問題定義：給定兩個字串 s 和 t（長度分別為 n 和 m），下標從 0 開始，定義extend[i]等於 s[i]... s[n-1] 與 t 的最長相同字首的長度，求出所有的extend[i]。舉個例子，看下表：i0

1234

567s

aaaa

abbb

taaa

aacextend[i]543

2100

0 為什麼說這是 kmp 演算法的擴充套件呢？顯然，如果在 s 的某個位置 i 有extend[i]等於 m，則可知在 s 中找到了匹配串 t，並且匹配的首位置是 i。而且，擴充套件 kmp 演算法可以找到 s 中所有 t 的匹配。接下來具體介紹下這個演算法。

如上圖，假設當前遍歷到 s 串位置 i，即extend[0]...extend[i - 1]這 i 個位置的值已經計算得到。設定兩個變數，a 和 p。p 代表以 a 為起始位置的字元匹配成功的最右邊界，也就是 "p = 最後乙個匹配成功位置 + 1"。相較於字串 t 得出，s[a...p)等於t[0...p-a)。

再定義乙個輔助陣列int next，其中next[i]含義為：t[i]... t[m - 1]與 t 的最長相同字首長度，m 為串 t 的長度。舉個例子：i0

1234

5taa

aaac

next[i]64

3210

s[i]對應t[i - a]，如果i + next[i - a] < p，如上圖，三個橢圓長度相同，根據 next 陣列的定義，此時extend[i] = next[i - a]。

（3）如果i + next[i - a] == p呢？如上圖，三個橢圓都是完全相同的，s[p] != t[p - a]且t[p - i] != t[p - a]，但s[p]有可能等於t[p - i]，所以我們可以直接從s[p]與t[p - i]開始往後匹配，加快了速度。

（4）如果i + next[i - a] > p呢？那說明s[i...p)與t[i-a...p-a)相同，注意到s[p] != t[p - a]且t[p - i] == t[p - a]，也就是說s[p] != t[p - i]，所以就沒有繼續往下判斷的必要了，我們可以直接將extend[i]賦值為p - i。

（5）最後，就是求解 next 陣列。我們再來看下next[i]與extend[i]的定義：

#include #include using namespace std;
/* 求解 t 中 next，注釋參考 getextend() */
void getnext(string & t, int & m, int next)
else
next[i] = next[i - a];
}}/* 求解 extend */
void getextend(string & s, int & n, string & t, int & m, int extend, int next)
else
**extend[i]** = next[i - a];
}}int main()
return 0;
}

資料測試如下：

aaaaabbb aaaaac next: 6 4 3 2 1 0 extend: 5 4 3 2 1 0 0 0 abcdef next: 3 0 0 extend: 0 0 0

擴充套件 KMP

KMP 擴充套件KMP

擴充套件kmp

擴充套件KMP

擴充套件 KMP

KMP 擴充套件KMP

擴充套件kmp

擴充套件KMP

相關推薦