字串匹配演算法BF KCP

所謂暴力匹配，就是從字串第乙個字元開始，乙個乙個與被匹配的字串按順序比對，如果有乙個不配，則字串右移一位，繼續重新開始乙個乙個比較，直到完全匹配或者匹配結束都沒有匹配上。

#include #include //bf暴力匹配字串

//在一段字串中匹配一段字串，如果匹配到，返回下標

int main ()

{ char str[18] = "li323243543";

char str1[4] = "3232";

int len,len1;

len = strlen(str);

len1 = strlen(str1);

int flag = 1; //匹配標誌

int startindex = 0; //字串滑動下標

int tempstartindex = -1;//字串下標

int index = 0; //匹配字串下標

while (flag == 1)

{startindex = tempstartindex++; //左移一位

for(;startindex以下**：字串匹配的kmp演算法

字串匹配是計算機的基本任務之一。

舉例來說，有乙個字串"bbc abcdab abcdabcdabde"，我想知道，裡面是否包含另乙個字串"abcdabd"？

許多演算法可以完成這個任務，knuth-morris-pratt演算法（簡稱kmp）是最常用的之一。它以三個發明者命名，起頭的那個k就是著名科學家donald knuth。

這種演算法不太容易理解，網上有很多解釋，但讀起來都很費勁。直到讀到jake boxer的文章，我才真正理解這種演算法。下面，我用自己的語言，試圖寫一篇比較好懂的kmp演算法解釋。

首先，字串"bbc abcdab abcdabcdabde"的第乙個字元與搜尋詞"abcdabd"的第乙個字元，進行比較。因為b與a不匹配，所以搜尋詞後移一位。

因為b與a不匹配，搜尋詞再往後移。

就這樣，直到字串有乙個字元，與搜尋詞的第乙個字元相同為止。

接著比較字串和搜尋詞的下乙個字元，還是相同。

直到字串有乙個字元，與搜尋詞對應的字元不相同為止。

這時，最自然的反應是，將搜尋詞整個後移一位，再從頭逐個比較。這樣做雖然可行，但是效率很差，因為你要把"搜尋位置"移到已經比較過的位置，重比一遍。

怎麼做到這一點呢？可以針對搜尋詞，算出一張《部分匹配表》（partial match table）。這張表是如何產生的，後面再介紹，這裡只要會用就可以了。

9.已知空格與d不匹配時，前面六個字元"abcdab"是匹配的。查表可知，最後乙個匹配字元b對應的"部分匹配值"為2，因此按照下面的公式算出向後移動的位數：

移動位數 = 已匹配的字元數 - 對應的部分匹配值

因為 6 - 2 等於4，所以將搜尋詞向後移動4位。

10.11.

因為空格與a不匹配，繼續後移一位。

12.逐位比較，直到發現c與d不匹配。於是，移動位數 = 6 - 2，繼續將搜尋詞向後移動4位。

13.14.

下面介紹《部分匹配表》是如何產生的。

首先，要了解兩個概念："字首"和"字尾"。 "字首"指除了最後乙個字元以外，乙個字串的全部頭部組合；"字尾"指除了第乙個字元以外，乙個字串的全部尾部組合。

15."部分匹配值"就是"字首"和"字尾"的最長的共有元素的長度。以"abcdabd"為例，

－　"a"的字首和字尾都為空集，共有元素的長度為0；

－　"ab"的字首為[a]，字尾為[b]，共有元素的長度為0；

－　"abc"的字首為[a, ab]，字尾為[bc, c]，共有元素的長度0；

－　"abcd"的字首為[a, ab, abc]，字尾為[bcd, cd, d]，共有元素的長度為0；

－　"abcda"的字首為[a, ab, abc, abcd]，字尾為[bcda, cda, da, a]，共有元素為"a"，長度為1；

－　"abcdab"的字首為[a, ab, abc, abcd, abcda]，字尾為[bcdab, cdab, dab, ab, b]，共有元素為"ab"，長度為2；

－　"abcdabd"的字首為[a, ab, abc, abcd, abcda, abcdab]，字尾為[bcdabd, cdabd, dabd, abd, bd, d]，共有元素的長度為0。

16.

"部分匹配"的實質是，有時候，字串頭部和尾部會有重複。比如，"abcdab"之中有兩個"ab"，那麼它的"部分匹配值"就是2（"ab"的長度）。搜尋詞移動的時候，第乙個"ab"向後移動4位（字串長度-部分匹配值），就可以來到第二個"ab"的位置。

字串匹配演算法字串匹配演算法總覽

字串匹配在文字處理裡非常重要，我們採用簡潔的python 把以下演算法一一實現並講解。樸素演算法 algorithm rabin karp 演算法有限自動機演算法 finite automation knuth morris pratt 演算法 kmp algorithm boyer moore ...

字串匹配演算法

首先引用一下另一篇文章中對字串匹配的介紹字串匹配指的是從文字中找出給定字串稱為模式的乙個或所有出現的位置。本文的演算法一律輸出全部的匹配位置。模式串在中用x m 來表示，文字用y n 來，而所有字串都構造自乙個有限集的字母表其大小為根據先給出模式還是先給出文字，字串匹配分為兩類方法 ...

字串匹配演算法

平常操作文字的時候，經常需要操作對字串進行操作。而字串中最重要的一種操作就叫匹配，字串的匹配演算法很多，人們最熟悉的莫過於kmp演算法了。今天就來談一談一些字串匹配演算法。先來說說大名鼎鼎的kmp演算法，這個演算法出現在無數的資料結構與演算法書上面。它的策略很簡單當模式串第k個字元不匹配主串中第s...

字串匹配演算法BF KCP

字串匹配演算法 字串匹配演算法總覽

字串匹配演算法

字串匹配演算法

相關推薦

字串匹配演算法字串匹配演算法總覽