比較基因組學常用分析軟體和分析方法

2021-10-10 05:13:17 字數 1422 閱讀 5471

比較基因組學常用分析軟體和分析方法

(1)同源基因的查詢

orthomcl or orthofinder;

(2)多序列比對

muscle / mafft / clustalw / t-coffee, muscle 效果好點

(3)調取保守區域,並收尾連線,形成supergene

gblocks

(4)進化樹構建

raxml mega 等, 很多文獻用raxml,phyml或mrbayes,因為ml樹和貝葉斯進化樹對核苷酸 / 氨基酸替代模型的選擇非常敏感,故在進行進化樹或分化時間構建之前,需對核苷酸 / 氨基酸替代模型進行選擇。(jmodeltest 對cdna進行替代模型選擇,prottest 對蛋白進行替代模型選擇)

構建樹的教程:

(5)分化時間分析 divergence time

mcmctree. paml中的乙個程式, beast2

(6)基因擴張收縮分析

cafe

(7)基因是否收到正選擇

codeml paml中乙個程式

一、為什麼需要選擇核苷酸替換模型

構建進化樹可以通過同源 dna序列或蛋白質分子的氨基酸序列來實現,其具體的步驟基本上是先選取生物資料(同源 dna 序列或蛋白質分子的氨基酸序列資料)與進化距離模型,然後對不同物種dna 或蛋白質的序列進行比對,再應用距離模型和比對結果計算進化距離,最後通過進化距離構建進化樹。

因此,選擇進化距離模型是構建進化樹的基礎,dna分子中基因的進化距離是通過對核苷酸替代數進行估計獲得的(當遺傳資訊從父代複製到子代時,往往會發生一些改變,這些改變稱為突變。突變是dna進化的動力。常見的突變模式有:替代,即乙個核苷酸被另乙個核苷酸所替代;插入,即插入乙個或多個核苷酸;刪除,即刪除乙個或多個核苷酸。但是在分析進化時,一般只考慮替代。),要估計核苷酸替代數,就必須應用核苷酸替代的數學模型。由於核苷酸替換模型的選擇直接影響進化距離的計算,進而對所構建的系統樹是否合理起決定作用。即本文中核苷酸替換模型選擇的問題?

二、核苷酸替換模型的選擇

選擇模型涉及兩個主要問題,一是採用什麼標準判斷模型與資料擬合好壞的問題,二是採用什麼方法計算選擇模型的目標函式。對於第乙個問題,目前提出的方法有似然率檢驗、aic資訊標準(information criteria)、貝葉斯因子(bic標準)和決策論法等。對於第二個問題,目前主要採用最大似然法和貝葉斯法兩種方法計算模型在給定資料集和系統樹上的似然值。

有了核苷酸替代模型,我們就可以計算進化距離。在同一替代模型中,對核苷酸替代速率做不同假設就會得到不同的進化距離(不同的進化距離構建得到不同的進化樹),常用的進化距離包括: p距離、替代率為常數的d 距離、替代數服從 [公式] 分布的 [公式] 距離 [公式] 。最後就可以通過進化距離構建系統樹。目前比較常用的替代模型包括:jc69模型、k80模型、f81模型、tn93模型。由於核苷酸替換模型的選擇直接影響進化距離的計算,進而對所構建的系統樹是否合理起決定作用。

比較基因組學

以 全基因組 測序為目標的 結構基因組學 structural genomics 以 基因功能鑑定 為目標的 功能基因組學 functional genomics 又被稱為後基因組 postgenome 比較基因組學 comparative genomics 是基於基因 譜和測序基礎上,對已知的基因...

基因組學 實驗

登入伺服器 linux機器上登入 ssh l public 172.28.215.241 windows機器上登入用putty客戶端 登入伺服器後請建立自己的目錄,以學號 姓名拼音命名,實驗資料和結果都放入這個目錄 設定環境變數 module add bioinfo linux學習資料 linux ...

影像組學ibex 影像基因組學

在重要精神疾病 精神 症 抑鬱症等 關鍵基因對腦結構或腦功能的調控研究方面,我們進行了系統探索,取得了系列研究結果。1 基於擴散張量影像研究了disc1對腦結構網路的影響,發現disc1 ser704cys基因型主要調控腦結構網路的資訊傳遞效率 li et al.2013 進一步的多模態影像學研究結...