字串匹配演算法加速 KMP

2021-10-08 10:15:12 字數 1842 閱讀 2224

資料結構學習總結:

kmp演算法,也就是用於字串匹配中的一種演算法。(即解決乙個主串中是否包含給定子串)

(1) 首先要理解乙個概念。

即=》某乙個字元的字首和字尾匹配的最長長度。

假設子串為abcabck,那麼k字元位置之前的字串的字首和字尾匹配的最長長度為3.

同理,如果字串為aaaaaab。那麼b位置時的字首和字尾匹配時的最長長度為5.

(2) 假設要在abcdedfdfdg中查詢能匹配abkm的子串。那麼我們就對abkm中的每乙個字元建立剛剛1中所說的最長匹配長度。

即分別在a,b, k, m各個位置建立各個字元的字首和字尾匹配的最長長度。最後的結果就會對應乙個陣列。先叫它next[4] 陣列。假設字串為aabad。那麼該對應的next陣列就是[-1,0,1,0,1];(最前面的a字元前沒有字元,人為規定它的字首和字尾匹配時的最長長度為-1).

(3) 現在我們有next陣列(具體求解演算法,稍後再詳細說。現在只需要先理解next所包含的資訊是什麼意思即可)。那麼如何利用next陣列來加速匹配過程,即 在不匹配時可以一次性往後多挪幾位。

用next 陣列加速實現原理如下:

kmp解法下:

(1)主串和子串匹配過程的**

/**

* 兩個字串的匹配過程

** @param s 主串

* @param m 模式串

* @return 返回匹配的第乙個字元位置

*/public int getres

(string s,string m)

char[

] str = s.

tochararray()

; char[

] match =m.

tochararray()

; int x=0;

//表示str中當前比對的位置

int y=0;

//表示match中當前比對的位置

int[

] next =

getnextarray

(match)

;//表示match中第i個字元前的字首和字尾匹配的最大長度

while

(xelse

if(next[y]==-

1)else

}return y==match.length?x-y:-1

;}

(2) next陣列的生成

//人為規定

next[1]

=0; int i =2;

int cn =0;

//和當前i-1位置比對的位置.初始值為0.因為當前i在2.i-1就為1.那麼與1位置比較的位置就是0位置

while

(ielse

if(cn>0)

else

}return next;

}

KMP演算法 字串匹配

kmp演算法基本思想 我們在用常規的思想做 字串匹配時候是 如 對如 字元如果 t abab 用p ba 去匹配,常規思路是 看 t 第乙個元素 a 是否 和p 的乙個 b 匹配 匹配的話 檢視各自的第二個元素,不匹配 則將 t 串的 第二個元素開始 和 p 的第乙個匹配,如此 一步一步 的後移 來...

KMP字串匹配演算法

kmp核心思想 計算模式串的next陣列,主串的索引在比較的過程中不回朔 ifndef kmp h define kmp h class kmp endif include kmp.h include include include using namespace std int kmp calcu...

KMP字串匹配演算法

在介紹kmp演算法之前,先介紹一下bf演算法。一.bf演算法 bf演算法是普通的模式匹配演算法,bf演算法的思想就是將目標串s的第乙個字元與模式串p的第乙個字元進行匹配,若相等,則繼續比較s的第二個字元和p的第二個字元 若不相等,則比較s的第二個字元和p的第乙個字元,依次比較下去,直到得出最後的匹配...