根據id提取fasta序列

bioperl讀入寫出fasta

要求根據序列id，從fasta檔案中提取目標序列並輸出

資料序列id

fasta檔案

思路以序列id為鍵，構建雜湊

用bioperl讀入fasta，獲得序列id

如果id存在於雜湊中，輸出序列

die "perl $0 " unless(@ar**==3);
#$0程式名
use bio::seqio;
use bio::seq;
$in = bio::seqio->new(-file=>"$ar**[1]", -format =>'fasta');
$out = bio::seqio->new(-file=>"$ar**[2]", -format=>'fasta');
my %keep=();
open (in, "$ar**[0]") or die "$!";
while()=1;
}close in;
while(my$seqobj = $in->next_seq())) 
}$in->close();
$out->close();

SeqKit根據ID提取序列

我們需要使用seqkit的grep功能來實現。首先官方的語句是這樣的 zcat hairpin.fa.gz seqkit grep f list new.fa 這是針對linux系統環境下。如果實在windows環境下，則要使用語句 type non snare.fasta seqkit grep ...

統計fasta序列條數

通過搜尋的數量 grep c myfasta.fasta 1397492 seqkit統計提取，速度也是很快的 seqkit stats t.fa t grep v file cut f 4 1397492 統計 1 100bp 範圍長的序列數 cat t.fa seqkit seq m 1 m ...

perl程式執行查詢指定id的fasta序列

本程式用於查詢指定序列id的fasta序列，基本思路就是將需要查詢的fasta檔案序列id存入乙個雜湊，然後遍歷目標fasta檔案，進行查詢。usr bin perl use strict use warnings my target ids my id my num open in1,ar 0 d...

根據id提取fasta序列

SeqKit根據ID提取序列

統計fasta序列條數

perl程式執行查詢指定id的fasta序列

相關推薦