DNA序列找GC Ratio最高子串行

2021-06-22 12:23:07 字數 592 閱讀 7343

乙個dna序列由a/c/g/t四個字母的排列組合組成。g和c的比例(定義為gc-ratio)是序列中g和c兩個字母的總的出現次數除以總的字母數目(也就是序列長度)。在基因工程中,這個比例非常重要。因為高的gc-ratio可能是基因的起始點。

給定乙個很長的dna序列,以及要求的最小子序列長度,研究人員經常會需要在其中找出gc-ratio最高的子串行。

知識點:  字串 

練習階段:  初級 

執行時間限制: 10sec

記憶體限制: 128mbyte

輸入:  

輸入乙個string型基因序列,和int型子串的長度

輸出:  

找出gc比例最高的字串

樣例輸入:

aactgtgcacgacctga 5

樣例輸出:

gcacg

#include #include #include char *getsubstring(char *str,int n)

}if(maxcnt==0)

return null;

else

}}int main()

重複的DNA序列

所有 dna 由一系列縮寫為 a,c,g 和 t 的核苷酸組成,例如 acgaattccg 在研究 dna 時,識別 dna 中的重複序列有時會對研究非常有幫助。編寫乙個函式來查詢 dna 分子中所有出現超多一次的10個字母長的序列 子串 示例 輸入 s aaaaacccccaaaaacccccca...

DNA序列的編碼

description對於dna 序列 序列中包含a c g 和t 四種字元 我們使用如下方法為它編碼 1 將子字串中的k 個相同字元寫成kx,x 是a c g 和t 四個字元之一 2 如果k 是1,那麼1 要忽略。輸入乙個dna 序列,輸出它的編碼。input 乙個dna 序列,由一串包含a c ...

DNA序列相關特徵

通常是指基因序列或蛋白質序列上連續的k個核苷酸或者氨基酸。在 基於遺傳演算法的加權整合學習及其對於pirna的 中通過統計所有k元組在pirna序列上出現的次數作為最後的特徵向量。定義dna序列為x,以k個字元長度為乙個單位在序列上進行掃瞄,然後統計出所有連續k元組出現的次數。最後將4的k次方個統計...