Muscle 進行多序列比對

2021-07-25 02:02:58 字數 592 閱讀 2104

muscle 進行多序列比對

**:軟體的主頁是

進入主頁,簡單看看軟體介紹,這個軟體還是蠻牛的,乙個人在家裡自己寫出來的,當然,對於普通人來說,這個軟體跟clustalw沒什麼區別,反正都是多序列比對啦!

準備資料,我這裡選擇的是幾個短小的蛋白

這裡有兩種比對方式,都是很簡單的命令

一種是先比對,再生成樹檔案(樹的格式是newick format, )

muscle -in mouse_j.pro -out mouse_j.pro.a

muscle -maketree -in mouse_j.pro.a -out mouse_j.phy (這裡有兩種構建樹的方式)

另外一種是比對成aln格式的資料,然後用其它軟體(phyml或者phylip)來生出樹檔案

muscle -in mouse_j.pro   -clwout seqs.aln

可以看到比對的效果還是蠻好的,是aln格式的比對檔案,這個格式非常常用

或者輸出phy格式的比對檔案,

muscle -in mouse_j.pro  -physout seqs.phy

可以被phyml等軟體識別,然後來構建進化樹,

muscle多序列比對簡單應用

沒有深入研究,只想對多序列做個比對,然後分組,具體命令如下 1 多序列比對 資料量不大,曾經用了乙個挺大的,直接吐核,放棄了,網上有說多執行緒操作,沒有用,照例吐 muscle in seqs.fa out seqs.afa 對於大資料集可以使用 我用了,直接報錯,不知道咋回事,希望能有成功的寶寶 ...

mVISTA 多序列比對葉綠體基因組

mvista可對2個或者多個dna序列進行比較,可以對比對結果進行視覺化。詳情請大力戳這裡 mvista 需要輸入的檔案有如下幾類 必須檔案 可選檔案 106481 116661 gene1 106481 106497 utr 107983 108069 exon 109884 110033 exo...

序列比對 levenshtein distance

一 兩個字串a和b,將a變為b需要經過最少幾次編輯 包括插入 刪除 替換 解決問題,俄羅斯人levenshtein設計了乙個演算法,名為levenshtein距離,具體如下 levenshtein的具體演算法是 1.獲取字串 的長度為n,獲取字串 的長度為m,如果m 0,返回n 如果n 0,返回m。...