perl統計各個fasta序列長度及其出現次數

2021-10-23 09:20:39 字數 559 閱讀 9219

#!/usr/bin/perl

use strict;

use warnings;

my$seq;my

%hash;my

$id;

my$length

;##讀取控制代碼,input為標準fasta資料格式,即一行id,一行序列

open in,

"$ar**[0]"

ordie$!;

##輸出檔名已經固定

open out,

">read_stats.txt"

ordie$!;

while()

else++;

#序列->次數 存入雜湊}}

##列印輸出表頭

print out "seq\tlength\tseq_num\n"

;##遍歷雜湊,並對序列出現次數排序

foreach

(sort

<=>

$hash

} keys %hash

)\n";}

close in;

統計fasta序列條數

通過搜尋 的數量 grep c myfasta.fasta 1397492 seqkit統計提取,速度也是很快的 seqkit stats t.fa t grep v file cut f 4 1397492 統計 1 100bp 範圍長的序列數 cat t.fa seqkit seq m 1 m ...

根據id提取fasta序列

bioperl讀入寫出fasta 要求根據序列id,從fasta檔案中提取目標序列並輸出 資料序列id fasta檔案 思路以序列id為鍵,構建雜湊 用bioperl讀入fasta,獲得序列id 如果id存在於雜湊中,輸出序列 die perl 0 unless ar 3 0程式名 use bio ...

perl程式執行查詢指定id的fasta序列

本程式用於查詢指定序列id的fasta序列,基本思路就是將需要查詢的fasta檔案序列id存入乙個雜湊,然後遍歷目標fasta檔案,進行查詢。usr bin perl use strict use warnings my target ids my id my num open in1,ar 0 d...