pfamscan 的使用 Hmmer安裝與使用

2021-10-13 01:38:07 字數 2029 閱讀 4906

從功能基因研究的角度來講,相關的搜尋,比如從序列資料庫中,找同源的序列,或者對乙個對乙個新的基因功能進行鑑定,使用hmmer比使用blast有著更高的靈敏度已經更高的搜尋速度,但其應用還遠沒有blast普及。

對於mac os/x, linux, unix系統,用源**編譯安裝:

% wget

% tar zxf hmmer-3.0.tar.gz

% cd hmmer-3.0

% ./configure

% make

% make check

hmmer包含的程式

phmmer: 與blastp類似,使用乙個蛋白質序列搜尋蛋白質序列庫;

> phmmer tutorial/hbb human uniprot sprot.fa

jackhmmer: 與psiblast類似,蛋白質序列迭代搜尋蛋白質序列庫;

> jackhmmer tutorial/hbb human uniprot sprot.fa

hmmbuild: 用多重比對序列構建hmm模型;

hmmsearch: 使用hmm模型搜尋序列庫;

hmmscan: 使用序列搜尋hmm庫;

hmmalign: 使用hmm為線索,構建多重比對序列;

> hmmalign globins4.hmm tutorial/globins45.fa

hmmconvert: 轉換hmm格式

hmmemit: 從hmm模型中,得到乙個模式序列;

hmmfetch: 通過名字或者接受號從hmm庫中取回乙個hmm模型;

hmmpress:格式化hmm資料庫,以便於hmmscan搜尋使用;

hmmstat: 顯示hmm資料庫的統計資訊;

使用hmm模型搜尋序列資料庫

使用hmmbuild構建hmm模型,輸入為stockholm格式或者fasta格式的多重比對序列檔案(如:tutorial/globins4.sto),命令如下:

> hmmbuild globins4.hmm tutorial/globins4.sto

globins4.hmm為輸出的hmm模型

使用hmmsearch搜尋蛋白質序列資料庫,蛋白質序列資料庫為fasta格式,命令如下:

> hmmsearch globins4.hmm uniprot sprot.fasta > globins4.out

globins4.out為輸出的結果檔案,如下:

*示例使用官方教程中的示例

使用蛋白質序列搜尋hmm資料庫

> hmmbuild globins4.hmm tutorial/globins4.sto

> hmmbuild fn3.hmm tutorial/fn3.sto

> hmmbuild pkinase.hmm tutorial/pkinase.sto

> cat globins4.hmm fn3.hmm pkinase.hmm > minifam

使用hmmpress格式化資料庫,包括壓縮以及建立索引,命令如下:

> hmmpress minifam

這個步驟可以很快的執行完成,輸出的內容如下:

working… done.

pressed and indexed 3 hmms (3 names and 2 accessions).

models pressed into binary file: minifam.h3m

ssi index for binary model file: minifam.h3i

profiles (msv part) pressed into: minifam.h3f

profiles (remainder) pressed into: minifam.h3p

使用hmmscan搜尋hmm資料庫,命令如下:

> hmmscan minifam tutorial/7less_drome

輸出如下:

後記這裡主要是乙個入門式的教程,介紹了hmmer的安裝,以及最常用功能使用的命令示例。其他程式的使用,以及每個程式的詳細引數說明,請參看官方手冊,

官方文件手冊(pdf):

類的使用,物件的使用

一 類的使用 class student school luffycity def eat self print yes defdrink self print drink 檢視print student.dict 增student.teacher gaohui print student.dict...

messagebox的使用(使用整理)

定義 messagebox顯示乙個模態對話方塊,其中包含乙個系統圖示 一組按鈕和乙個簡短的特定於應用程式訊息,如狀態或錯誤的資訊。訊息框中返回乙個整數值,該值指示使用者單擊了哪個按鈕。messagebox hwnd hwnd text,caption pchar type word hwnd 訊息框...

gulp的使用基本使用

1.全域性安裝gulp 目的是在命令列裡使用gulp的命令 2.命令列中cd到專案目錄,區域性安裝gulp 如果不在專案中再次安裝會報錯,據說這樣是為了避免發生版本衝突 3.在專案目錄下新建乙個gulpfile.js檔案 必須這個名字,這個檔案算是乙個配置檔案 編寫我們的需求,以便gulp能按著我們...