muscle多序列比對簡單應用

2021-10-07 13:34:48 字數 985 閱讀 5711

沒有深入研究,只想對多序列做個比對,然後分組,具體命令如下:

1、多序列比對(資料量不大,曾經用了乙個挺大的,直接吐核,放棄了,網上有說多執行緒操作,沒有用,照例吐)

muscle -in seqs.fa -out seqs.afa

對於大資料集可以使用(我用了,直接報錯,不知道咋回事,希望能有成功的寶寶)

muscle -in seqs.fa -out seqs.afa -maxiters 2

2、序列轉變為clustalw格式

muscle -in seq.afa -clw  -out seq.clw

因為clw檔案是分段顯示的,我用python做了合併,輸出整體序列比對結果(很不幸,這次比對不太好,我大概要棄了muscle,試下cd-hit,實在不行還得後續想辦法,哭泣。。。)

import json

dict={}

with open('seq.clw','r')as js:

for line in js.readlines():

print(line)

if line.isspace():

continue

else:

s=line.split( )

print(s)

if s[0] in dict.keys():

dict[s[0]]=dict[s[0]]+s[1]

else:

dic=

dict.update(dic)

js.close()

filew=open('catclw.clw','w')

for key in dict.keys():

filew.write(key+" "+dict[key]+"\n")

filew.close()

3、根據多重比對結果構建upgma樹

muscle -maketree -in seqs.afa -out seqs.phy

Muscle 進行多序列比對

muscle 進行多序列比對 軟體的主頁是 進入主頁,簡單看看軟體介紹,這個軟體還是蠻牛的,乙個人在家裡自己寫出來的,當然,對於普通人來說,這個軟體跟clustalw沒什麼區別,反正都是多序列比對啦!準備資料,我這裡選擇的是幾個短小的蛋白 這裡有兩種比對方式,都是很簡單的命令 一種是先比對,再生成樹...

mVISTA 多序列比對葉綠體基因組

mvista可對2個或者多個dna序列進行比較,可以對比對結果進行視覺化。詳情請大力戳這裡 mvista 需要輸入的檔案有如下幾類 必須檔案 可選檔案 106481 116661 gene1 106481 106497 utr 107983 108069 exon 109884 110033 exo...

多序列比對要多久時間 古箏基本功學習要多久的時間?

古箏基本功學習時間學古箏的過程是乙個艱苦的過程,不是一朝一夕就能完成的,有的人學箏,乙個星期就能學一首曲子,隔著許多曲子蹭蹭往上跳,再甩掉一些不學的,幾年就把古箏學完了,這不好。學箏過程中要學好一首再去學另一首,而不要學的拌拌磕磕就換下一首學。要高標準 嚴要求,有曲不驚人誓不休的精神,不要去過多的追...