最長公共子串行問題 動態規劃法

2021-06-23 03:44:23 字數 2873 閱讀 3195

經常會遇到複雜問題不能簡單地分解成幾個子問題,而會分解出一系列的子問題。簡單地採用把大問題分解成子問題,並綜合子問題的解匯出大問題的解的方法,問題求解耗時會按問題規模呈冪級數增加。

為了節約重複求相同子問題的時間,引入乙個陣列,不管它們是否對最終解有用,把所有子問題的解存於該陣列中,這就是動態規劃法所採用的基本方法。

【問題】 求兩字串行的最長公共字元子串行

問題描述:字串行的子串行是指從給定字串行中隨意地(不一定連續)去掉若干個字元(可能乙個也不去掉)後所形成的字串行。令給定的字串行x=「x0,x1,…,xm-1」,序列y=「y0,y1,…,yk-1」是x的子串行,存在x的乙個嚴格遞增下標序列,使得對所有的j=0,1,…,k-1,有xij=yj。例如,x=「abcbdab」,y=「bcdb」是x的乙個子串行。

考慮最長公共子串行問題如何分解成子問題,設a=「a0,a1,…,am-1」,b=「b0,b1,…,bm-1」,並z=「z0,z1,…,zk-1」為它們的最長公共子串行。不難證明有以下性質:

(1) 如果am-1=bn-1,則zk-1=am-1=bn-1,且「z0,z1,…,zk-2」是「a0,a1,…,am-2」和「b0,b1,…,bn-2」的乙個最長公共子串行;

(2) 如果am-1!=bn-1,則若zk-1!=am-1,蘊涵「z0,z1,…,zk-1」是「a0,a1,…,am-2」和「b0,b1,…,bn-1」的乙個最長公共子串行;

(3) 如果am-1!=bn-1,則若zk-1!=bn-1,蘊涵「z0,z1,…,zk-1」是「a0,a1,…,am-1」和「b0,b1,…,bn-2」的乙個最長公共子串行。

這樣,在找a和b的公共子串行時,如有am-1=bn-1,則進一步解決乙個子問題,找「a0,a1,…,am-2」和「b0,b1,…,bm-2」的乙個最長公共子串行;如果am-1!=bn-1,則要解決兩個子問題,找出「a0,a1,…,am-2」和「b0,b1,…,bn-1」的乙個最長公共子串行和找出「a0,a1,…,am-1」和「b0,b1,…,bn-2」的乙個最長公共子串行,再取兩者中較長者作為a和b的最長公共子串行。

求解:引進乙個二維陣列c,用c[i][j]記錄x[i]與y[j] 的lcs 的長度,b[i][j]記錄c[i][j]是通過哪乙個子問題的值求得的,以決定搜尋的方向。

我們是自底向上進行遞推計算,那麼在計算c[i,j]之前,c[i-1][j-1],c[i-1][j]與c[i][j-1]均已計算出來。此時我們根據x[i] = y[j]還是x[i] != y[j],就可以計算出c[i][j]。

注:對於b[i][j]的理解,求解最長公共子串行,最長的子串行的獲得可能是在上一步求解基礎上x序列方向上遞增乙個得到的,有可能是y序列方向上遞增乙個得到的,也有可能是x序列和y序列同時遞增乙個得到的。所以程式中使用了0,1,-1來賦值給b陣列,表示當前位置對應的c陣列中的最優解是來自於左上方(0)、1(上方)或-1(左方)。

所以問題的的求解過程可以描述為:

求解過程中c陣列中的值為:

分析:在陣列c中使用了多餘的一行c[0]和多餘的一列c[0],這樣做的好處是,這一行和這一列賦上初值0之後,會簡化後面的計算,因為上面的分析下一步的最優解可能來自於左上、上、左三個方向的值。可以看到c陣列中每乙個位置上的值都是兩個序列長度分別為i和j時最長子序列的值。

程式為:

#include #include #define maxlen 100

void lcslength(char *x, char *y, int m, int n, int c[maxlen], int b[maxlen])

else if(c[i-1][j] >= c[i][j-1]) /*來自性質(2)*/

else /*來自性質(3)*/}}

}void printlcs(int b[maxlen], char *x, int i, int j)

else if(b[i][j] == 1)

printlcs(b, x, i-1, j);

else

printlcs(b, x, i, j-1);

}int main(int argc, char **argv)

; char y[maxlen] = ;

int b[maxlen][maxlen];

int c[maxlen][maxlen];

int m, n;

m = strlen(x);

n = strlen(y);

lcslength(x, y, m, n, c, b); /*計算最長公共序列*/

/*輸出最長公共序列,可能有多個解,這裡只輸出乙個*/

printf("answer is: ");

printlcs(b, x, m, n);

printf("\n");

return 0;

}

程式輸出結果:

注意:程式的解可能遠不止這乙個,因為從圖上可以至少再得出bcab以及bdab兩個解,如果要得出每乙個解,需要完善的地方是在c最後一行和最後一列,有許多值都跟c[m][n]也就是其最後乙個單元的值一致,這種一致的值也可能是乙個最優解(當然也可能是重複的),最優的解一定都在這兩條直線上,因為有c[i][j] >= c[i-1][j]、c[i][j] >= c[i][j-1]、c[i][j] > c[i-1][j-1]總是成立。另外在程式中當x[i-1] != y[j-1],本來應該取左方的值或者上方的值,但是左方的值和上方的值有可能是相等的,程式中並沒有單獨處理,這個時候可以用乙個判等的將方向的陣列b賦值為2(只要不是0,1,-1即可),表示這個值可以接收來自兩個方向,這樣才能保證解的完整性,這裡就不具體實現了。

動態規劃法如何來解決最長公共子串行問題

最長公共子串行問題。設有兩個字串行x和y,它們的元素分別存放在陣列x m 1 和y n 1 中,x 0 和y 0 不放元素。公共子串行存放在陣列z中。完成如下函式。2 int commonorder int m,int n,char x,char y,char z 函式功能是返回兩字串行的最長公共子...

動態規劃 最長公共子串行問題

最長公共子串行問題 longest common subsequence problem 簡稱lcs問題。題目為給定兩個序列x y求它們的lcs 最長公共子串行 這裡的子串行z的定義為 z中的元素既在x中也在y中,並且他們在x y中滿足嚴格的下標為乙個增序列 假設下標從左到右依次增大 另外,不要求z...

最長公共子串行問題 動態規劃

給定兩個字串s1s2.sn和t1t2.tn。求出這兩個字串最長的公共子串行 輸入 abcicba abdkscab 輸出 abca 定義dp i j 為s1 si和t1 tj對應的lcs的長度 s1 si 1和t1 tj 1對應的公共子列有三種情況 當si 1 tj 1時,在s1 si和t1 tj的...