根據id提取fasta序列

2021-09-24 04:24:50 字數 688 閱讀 3239

bioperl讀入寫出fasta

要求根據序列id,從fasta檔案中提取目標序列並輸出

資料序列id

fasta檔案

思路以序列id為鍵,構建雜湊

用bioperl讀入fasta,獲得序列id

如果id存在於雜湊中,輸出序列

**

die "perl $0 " unless(@ar**==3);

#$0程式名

use bio::seqio;

use bio::seq;

$in = bio::seqio->new(-file=>"$ar**[1]", -format =>'fasta');

$out = bio::seqio->new(-file=>"$ar**[2]", -format=>'fasta');

my %keep=();

open (in, "$ar**[0]") or die "$!";

while()=1;

}close in;

while(my$seqobj = $in->next_seq()))

}$in->close();

$out->close();

SeqKit根據ID提取序列

我們需要使用seqkit的grep功能來實現。首先官方的語句是這樣的 zcat hairpin.fa.gz seqkit grep f list new.fa 這是針對linux系統環境下。如果實在windows環境下,則要使用語句 type non snare.fasta seqkit grep ...

統計fasta序列條數

通過搜尋 的數量 grep c myfasta.fasta 1397492 seqkit統計提取,速度也是很快的 seqkit stats t.fa t grep v file cut f 4 1397492 統計 1 100bp 範圍長的序列數 cat t.fa seqkit seq m 1 m ...

perl程式執行查詢指定id的fasta序列

本程式用於查詢指定序列id的fasta序列,基本思路就是將需要查詢的fasta檔案序列id存入乙個雜湊,然後遍歷目標fasta檔案,進行查詢。usr bin perl use strict use warnings my target ids my id my num open in1,ar 0 d...