洛谷P1140 相似基因

2021-08-20 03:14:13 字數 1457 閱讀 4493

大家都知道,基因可以看作乙個鹼基對序列。它包含了4種核苷酸,簡記作a,c,g,t。生物學家正致力於尋找人類基因的功能,以利用於診斷疾病和發明藥物。

在乙個人類基因工作組的任務中,生物學家研究的是:兩個基因的相似程度。因為這個研究對疾病的**有著非同尋常的作用。

兩個基因的相似度的計算方法如下:

對於兩個已知基因,例如agtgatg和gttag,將它們的鹼基互相對應。當然,中間可以加入一些空鹼基-,例如:

這樣,兩個基因之間的相似度就可以用鹼基之間相似度的總和來描述,鹼基之間的相似度如下表所示:

那麼相似度就是:(-3)+5+5+(-2)+(-3)+5+(-3)+5=9。因為兩個基因的對應方法不唯一,例如又有:

相似度為:(-3)+5+5+(-2)+5+(-1)+5=14。規定兩個基因的相似度為所有對應方法中,相似度最大的那個。

輸入格式:

共兩行。每行首先是乙個整數,表示基因的長度;隔乙個空格後是乙個基因序列,序列中只含a,c,g,t四個字母。1<=序列的長度<=100。

輸出格式:

僅一行,即輸入基因的相似度。

輸入樣例#1:

7 agtgatg

5 gttag

輸出樣例#1:

14
問題分析

資料處理:

將字串轉換成陣列a與b,並打出tab表來表示匹配值。用dp[i][j]表示第乙個陣列的前i行和第二個陣列的前j行的相似度。

轉移方程:

我們可以選擇將a[i]與b[j]直接配對,或者將a[i]或b[j]與空格配對。這樣可以得到轉移方程dp[i][j]=max(dp[i-1][j-1]+tab[a[i]][b[j]],dp[i-1][j]+tab[a[i]][4],dp[i][j-1]+tab[4][b[j]])。

邊界處理:

如果乙個串為空,則另乙個一定全部對應的是空格,於是可設定dp[0][i]與dp[i][0]的初值。dp[0][0]設為0,因為空格與空格對應為0(很重要)。

**

#includeusing namespace std;

const int n=210;

const int tab[5][5]=

, ,,,

};char x[n],y[n];

int n,m,a[n],b[n],dp[n][n];

int main()

printf("%d",dp[n][m]);

return 0;

}

洛谷P1140 相似基因

大家都知道,基因可以看作乙個鹼基對序列。它包含了44種核苷酸,簡記作a,c,g,ta,c,g,t。生物學家正致力於尋找人類基因的功能,以利用於診斷疾病和發明藥物。在乙個人類基因工作組的任務中,生物學家研究的是 兩個基因的相似程度。因為這個研究對疾病的 有著非同尋常的作用。兩個基因的相似度的計算方法如...

洛谷P1140 相似基因

本題一看就知道是一道動歸,其實和字串距離非常的像,只不過多了題目規定的匹配相似度罷了。int shuzu 6 6 ps 換行效果更佳。int start char c 然後直接在主函式中呼叫即可 for int i 0 i其中s1,s2均為讀入的字串,我們把它們分別逐字元轉化放入a,b陣列。for ...

洛谷P1140 相似基因

本題一看就知道是一道動歸,其實和字串距離非常的像,只不過多了題目規定的匹配相似度罷了。int shuzu 6 6 ps 換行效果更佳。int start char c 然後直接在主函式中呼叫即可 for int i 0 i其中s1,s2均為讀入的字串,我們把它們分別逐字元轉化放入a,b陣列。for ...