生物資訊百Jia軟體(八) blat

2021-09-25 20:39:47 字數 1756 閱讀 2639

一、功能分類:

區域性比對

二、軟體官網:

三、軟體介紹:

blat的全稱是the blast-like alignment tool,可以稱為"類blast 比對工具",由w.james kent於2023年開發。當時隨著人類基因組計畫的進展,把大量基因和ests 快速定位到較大的基因組上成為一種迫切的需求。

blast 對於這種比對需求有幾個缺陷:

1、速度偏慢;

2、結果難於處理;

3、無發表示出包含內含子的基因定位。

blat比對軟體 就是在這種形勢下應運而生了。

另外,相對於blast,blat使用簡單,速度更快,而且不需要建庫過程,可以輸出多種比對格式的比對結果。

blat特別適合將基因、cds重新定位到染色體上,這個在轉錄組分析中非常有用。在真核生物中,mrna在加工成熟過程中需要切出內含子,轉錄本也存在可變剪下,也就是假設乙個基因有1234四個外顯子,那麼最終得到的cds可能是123,也可能是124,這是如果在將測序出來的轉錄本定位到基因組上,124三個外顯子需要分別定位到三個位子,如果是blast就會斷成3個比對,而blat卻會識別出這是乙個比對,存在多個gap,很好了解決了轉錄本定位到基因組上的問題。

blat的一些重要選項引數。

-nohead 不輸出表頭資訊,這個在進行下一步軟體處理時比較方便,如果對格式很熟悉,不輸出以可以;

-out 選擇輸出格式。可以選擇lastz的axt格式,maf格式,wublast格式和blast m0 m8和m9格式。

-t 和-q和-prot引數指定比對的型別。blat也可以進行氨基酸比對和核酸在氨基酸水平比對。blast是通過-p指定比對型別,而blat則是通過分別指定query和subject的格式來解決這個問題。-t可以等於dna和prot蛋白質和dnax,-q可以等於dna,rna,prot,dnax和rnax等,如果需要核酸序列檔案在氨基酸水平比對,那-t和-q都應該等於dnax,

氨基酸比對時間要慢一些。-prot指定二者都是氨基酸序列。

剩餘很多引數都是用來限制比對條件的,例如是否處理n鹼基gap,重複序列,polya、比對字長、identity,比分等,可以根據具體比對進行調節。

六、使用案例:

blat ref.fna query.fna blat.out

blat genome.fna gene.ffn -out=axt blat.out

七、結果解析:

程式預設輸出為psl格式的列表結果檔案。

psl 格式的結果包含了詳細的比對位置資訊,每一列的意義都 在檔案開頭列出。第1~8列是總體的比對統計,包括精確比對鹼基數、錯配、query 和subject上的gap個數總長等等;第9~17 列是比對位置資訊,包括比對方向、query 和subject 的名字、長度、比對起止位置;18~21 列是顯示每乙個精確比對的block 的資訊,包括blocks 數、每個block的長度和在query、subject上的位置。

對於psl輸出結果,需要注意幾點。

1、blat 的結果在subject 上允許存在很大的gap(intron 區域),所以同乙個結果在query和subjects 上覆蓋的區域可能會相差很多,這一點與blast 不同。

2、在基因對基因組的 比對中,block 的個數不能等同於exon 的個數。因為blat 對block的定義是乙個沒有插入缺失的比對,任何 插入或者缺失的鹼基都會使乙個block 終止,所以乙個exon 很可能是由很多blocks 構成的。因此exon 和intron 的個數 要通過足夠大的gap 來判斷。

3、psl 結果裡面鹼基位置的計算是從0 開始的而不是1。

生物資訊百Jia軟體(十三) clustalw

通哥點評 clustalw是一款經典的多序列比對工具,在高通量測序開始之前已經被廣泛使用了,具有非常高的引用率。可以進行多個同源基因的多序列比對,比對完成之後可以用於構建分子數。在高通量測序時代,clustalw依然具有重要的作用。是一款需要掌握的生物資訊工具。一 功能分類 多序列比對 二 軟體官網...

生物資訊百Jia軟體(十六) tRNAscan

通哥點評 與rnammer工具類似,trnascan專門用於轉運rna的 由於轉運rna具有固定模式,而且非常顯著的倒三葉草模式,因此 並不難,準確性也比較高,所以,在這個分析方面基本上沒有對手,也沒有太多類似的工具,對於trna 掌握這一款工具就差不過夠了。一 功能分類 轉運rna 二 軟體官網 ...

生物資訊百Jia軟體(十九) cope

通哥點評 cope也是華大團隊出品的一款軟體,和soap系列其他軟體類似,功能強大,使用簡單,支援多種模式進行具有overlap的pairend reads進行連線,連線的效果非常不錯,其實我覺得要比flash,fastq join這些工具好用的。一 功能分類 pairend read連線工具 二 ...