兩條序列聯配

2021-10-09 14:38:58 字數 557 閱讀 7360

一、 序列聯配的概念

序列聯配又叫序列比對,根據特定的計分規則,通過演算法對多條蛋白質序列或dna序列進行比對,找出最優匹配和最大相似度匹配。通過聯配可以得到乙個相似度比對值(根據計分規則算),這個值反映了他們的相似度、同源性、進化上的親緣關係。

序列聯配分為區域性聯配和全域性聯配兩種。全域性聯配就是對整個序列進行比對,而區域性聯配是得到得分最高的比對結果。

序列聯配需要:兩條以上序列、計分規則(生物資訊學稱計分矩陣)、確定最優聯配的演算法、統計方法。

二、計分矩陣

又叫替換矩陣,給出鹼基或氨基酸的匹配值或錯配值。

1.計分矩陣的原理

計分矩陣即規定,某兩個元素(鹼基或氨基酸)匹配的得分值和不匹配的扣分值。

dna序列聯配的計分矩陣通常比較直觀,鹼基相同的一律加a分,不同的一律扣b分。而對於蛋白質,顯然不能簡單的定義匹配加一分,不匹配扣一分。同樣是匹配,如果兩個常見元素匹配加1分,兩個罕見元素匹配至少得加2分吧。不匹配的情況下,兩個不同的元素可能起到的作用是相同的,這樣應該給他們加分。所以這種負責的情況,沒有一種特定的矩陣能適用於所有情況,要根據不同的蛋白家族和預期構建不同的計分矩陣。

全域性序列聯配

注意不是最長子序列 lcs,lcs問題對應於匹配則獎勵1,插缺則沒有懲罰。如果要對插缺進行統計分析,則屬於序列聯配問題,最佳序列聯配求出的並不是最長子序列 對有k個字母的字符集a進行擴充套件,加入缺口符號 並提出得分矩陣為 k 1 k 1 矩陣,將聯配中的列 x,y 記為 x,y 將聯配的得分定義為...

一條分兩條

一條拆成兩條 統計當前客戶經理和客戶關係,上年底客戶經理和客戶關係 如果客戶經理和客戶關係跨越這兩個時間段,那麼一條分成兩條 with basic t as 客戶和客戶經理關係表 select 123 cust no,a am no,20091231 start dt 29991231 end dt...

牛客 兩條斜線

題意 斜率為 1的兩條直線最多經過幾個點。題解 設斜率為1的直線為y x b1,斜率為 1的直線為y x b2,b1 y x,b2 y x,b1或b2相同則點在這兩條直線上。所以問題變成了最多有幾個點的b1或b2相同,那麼列舉b1b2即可。include using namespace std ma...