生物序列比對與計算智慧型

2021-04-26 15:27:20 字數 1625 閱讀 1326

生物資訊學的首要任務之一就是從資料庫中搜尋同源序列,尋找保守的序列模式。而序列比對是最常用的方法,對於發現生物序列中的功能、結構和進化的資訊具有非常重要的意義。

下面給出序列比對的定義:定義:

序列比對問題可以表示為乙個五元組

msa = (

, s , a , f) ,其中:

(1)= ∑∪

為序列比對的符號集; 「

- 」表示空位

( gap) ;

∑表示基本字符集,對於

dna 序列,

∑= 代表4

個鹼基;

對於蛋白質序列,∑由

20個字元組成

,每個字元代表一種氨基酸殘;

(2)

= 為序列集;

(3)

矩陣a =

, m

≥max ,

∈是序列集

s的乙個比對結果,其中

:矩陣的第

i行是參與比對的第

i個序列的擴張序列

(即插入空位的序列

,如果移去所有的「

- 」將得到原來的序列

) ;矩陣中的每一列不允許同時為「

- 」;

(4) f

是比對a

的相似性度量函式

,用來表示比對

a 中各擴張序列的相似度;

(5)

序列比對問題

msa

就是通過適當的空位插入

,構建乙個使得相似性度量函式

f( a)

達到最大的比對a。

序列比對問題的求解演算法一般分為兩類來考慮,即雙序列比對和多序列比對。

目前,序列比對中存在的主要問題在於:如何給出乙個合理的優化的相似性度量準則以及如何提高分歧多序列比對的準確率。由於新興的計算智慧型的優良特性,在眾多的生物序列比對演算法中異軍突起,越來越多的被得到運用和發展。

什麼是計算智慧型?

計算智慧型也被稱作「軟計算」,是根據自然界生物體系的原理和規律,模仿設計出具有記憶、學習、適應等特性的求解演算法的總稱。這些演算法通過計算機模擬和再現了生物的某些智慧型行為,典型的代表如遺傳演算法、免疫演算法、模擬退火演算法、蟻群演算法、微粒群演算法,都是一種仿生演算法,其最大特點就是不需要建立問題本身精確的數學模型,適合於解決那些因為難以建立有效的形式化模型而用傳統人工智慧技術又難以有效解決甚至無法解決的問題。除此以外,智慧型計算還具有簡單、通用、魯棒性強、適於並行處理的優點,使其在並行搜尋、聯想記憶、模式識別、知識自動獲取等方面得到了廣泛的應用。自

80年代中後期以來計算智慧型在眾多領域的科學家加入下得到了極大的發展。

計算智慧型有別於傳統的符號智慧型。符號智慧型是以知識為基礎,通過推理進行問題求解,也即傳統的人工智慧;而計算智慧型則是以資料為基礎,通過訓練建立聯絡,進行問題求解。計算智慧型是以聯接主義為主的思維方式,即:研究簡單個體如何在簡單互動規則指導下,構成具有複雜智慧型行為的高層系統。

但是由於計算智慧型方法在序列比對中的應用還處於初步階段,實驗結果並不是很理想,比對的準確率以及演算法的時間複雜度都有待於提高。另外,計算智慧型中的一些方法還沒有應用進來,這除了有這些演算法的適應範圍的因素外,還有乙個重要的問題就是數學建模的問題。如果建模得當,那麼新的演算法應用進來,也是大有前景的。

生物序列區域性比對之Blast演算法

演算法基本原理 blast演算法是 1990 年由altschul 等人提出的兩序列區域性比對演算法,採用了一種短片段匹配演算法和一種有效的統計模型來找出目的序列和資料庫之間的最佳區域性比對效果。blast 演算法是一種基於區域性序列比對的序列比對演算法。廣泛被使用在蛋白質 dna序列的分析問題中,...

元素比對 序列比對 十二 計算後驗概率

原創 hxj7 本文介紹如何計算狀態的後驗概率。的概率。很明顯,此概率為一後驗概率。要計算上述後驗概率,可以經過以下推導 其中 根據公式 1 4 5 6 可以重新計算後驗概率 據公式 7 後驗概率計算就簡單多了。可以利用前文 稍加增改即可。執行效果如下 state state 所有的可能狀態 res...

序列計算機與平行計算 併發計算的比較

原文 從序列到並行,從並行到分布式 假設有ab兩個任務,則序列 並行 併發的區別如圖1所示。序列 a和b兩個任務執行在乙個cpu執行緒上,在a任務執行完之前不可以執行b。即,在整個程式的執行過程中,僅存在乙個執行上下文,即乙個呼叫棧乙個堆。程式會按順序執行每個指令。並行 並行性指兩個或兩個以上事件或...