KMP演算法描述

kmp演算法是一種優秀的字串匹配演算法，字串匹配的常規演算法是一步一步進行移位和比較操作，直至找到完全相匹配的字串。

下面通過乙個例子，為大家仔細說明kmp演算法的使用和思路：

問題：在字串「deabcdababcdabcdabde」字串中，匹配字串"abcdabd".

演算法思路：

kmp演算法的思路在於，根據已經匹配的部分字元的資訊，不把搜尋位置移回已經比較過的位置，這樣就提高了效率，是不是還是有點不清楚？沒關係，讓我們來根據乙個例子來切實體會一下kmp演算法是如何實現的。

**：1、kmp演算法的核心是一張「部分匹配表」，這個表是怎麼來的，後面再說，先用了再說，下圖就是該問題的部分匹配表。

這個表上面一行是我們的模式字串，下面一行是每個字元所對應的匹配值

移位規則是移動位數 = 已匹配的字串長度 - 已匹配字串的最後一位字元所對應的匹配值。

2、接下來就開始進行操作

上圖中我們看到，移位兩位後，我們找到了部分匹配的字串"abcdab"，但並沒有找到完全匹配的字串，如果是常規思路，就是在繼續往下一步一步移位，但我們這裡不這樣進行，我們觀察到，已經匹配的字串長度是6，匹配到的最後乙個字元是"b",查詢部分匹配表，這個「b」的部分匹配值是2，那麼根據我們演算法的移位規則，下一步我們的移位長度 = 6 - 2 = 4；

╮(╯▽╰)╭，有沒有發現，移了4位之後，剛好到達了下乙個「ab」處？是不是很神奇？好了，打住，我們繼續往下移，當前已匹配的字串長度為2，查詢這個「b」的匹配值為0（別和上個b搞混了），根據演算法，我們接下來移位長度是 2 - 0 = 2；

繼續，和前面的步驟相同，我們這次移位長度為 6 - 2 = 4；

至此，我們已經找到了完全匹配的字串，當然，如果母字串的長度較長，我們可以繼續進行移位，繼續尋找，和之前的步驟相同，下次我們移位長度為 7 - 0 = 7。

演算法分析：

不知道大家看到現在，有沒有一點明悟？來，讓我們分析一下模式字串「abcdabd」：

對於搜尋來說，我們首先關注的肯定是第乙個字元，如果第乙個字元都不匹配，那麼後面的字元就沒有比較的必要了，該目標字串的第乙個字元是』a『，讓我們看看這個字串裡有沒有』a『，誒，還真有，假如說我們現在已經匹配了「abcda」，5個字元，我們要移4位才能從第乙個'a'移到第二個'a'，』a『只有乙個字元，5 - 1 = 4;

再往下看，關注完第乙個字元，我們開始關注和第乙個字元依次相連的子字串，這些字串有乙個共性，就是第乙個字元都是』a『，那我們看看這種字串能有多少，"ab","abc","abcd","abcda","abcdab","abcdabd"，再看看這些字串在目標字串「abcdabd」中存在幾個，可以看出，除去和第乙個「a」相連的，「ab」還有乙個，其餘的沒有，而"ab"長度為2，所以在表中，第二個b的匹配值為2。

該演算法的核心思路在於，有時候，字串的頭部和尾部可能會有重複。

不知道大家有沒有聽懂？讓我們把匹配字串換一下，換成「abcdabc」，現在的部分匹配表應該是：

演算法思考和延伸：

如果模式字串過長，部分匹配表的生成會占用較多的時間，如何去提高部分匹配表的生成效率，是該演算法的優化所在。（個人觀點，如有大佬，請指教！）

該演算法思想和字典編碼有一定的相通之處。改天我會寫出乙個字典編碼的文章。敬請期待！

KMP演算法描述

KMP 演算法詳解（c語言描述）

資料結構通俗語言描述KMP演算法核心

演算法 KMP演算法

KMP演算法描述

KMP 演算法詳解（c語言描述）

資料結構 通俗語言描述KMP演算法核心

演算法 KMP演算法

相關推薦

資料結構通俗語言描述KMP演算法核心