FASTA Q序列處理神器 seqkit

2022-07-22 06:30:11 字數 1583 閱讀 2459

該軟體對於處理fasta/q十分方便,省去自己編寫指令碼

1 conda install seqkit

1

## 取方向序列

2 seqkit seq test.fa -r >test_re.fa34

## 取互補序列

5 seqkit seq test.fa -p >test_com.fa67

## 取方向互補序列

8 seqkit seq test.fa -r -p >test_re_com.fa910

## rna---> dna序列

11 seqkit seq test.fa rna2dna >test_dna.fa

1213

## 小寫字母輸出

14 seqkit seq test.fa -l >test_lower.fa

1516

## 大寫字母輸出

17 seqkit seq test.fa -u >test_upper.fa

1819

## 指定每行序列的輸出長度(為0的話,代表為一整行,預設的輸出 長度是60個鹼基)

20 seqkit seq test.fa -w 10 >test_10.fa (指定序列的長度為10)

2122

## 將多行序列轉換為一行序列

23 seqkit seq test.fa -w 0 >test_w.fa

2425

## 只輸出序列

26 seqkit seq test.fa -s -w 0 >test_seq.fa

2728

## 將只輸出的序列的,指定每行輸出的鹼基數

29 seqkit seq test_seq.fa -s -w 40 > test_seq40.fa

1

## 將fataq檔案轉化為fasta格式.

2 seqkit fq2fa test.fq -o test.fa34

## 將fasta格式轉化為tab格式

5 seqkit fx2tab test.fa > test_tab.fa (沒有seq引數)

1

## 序列鹼基含量

2 seqkit fx2tab -l -g -n -i -h test.fa34

## 序列長度的整體分布統計

5 seqkit stat test.fa

1

## 給定基因名字,gene.txt; 從基因所對應的fasta檔案提取序列;

2 seqkit grep -f gene test.fa |seqkit seq -i >gene.fa

3 ## 引數

4 -i: 只輸出id,後面的資訊不輸出,比如長度等資訊

seq與Shell序列生成

oracle scaqad02adm01 lstorm t.sh12 345 oracle scaqad02adm01 lstorm cat t.sh usr bin sh set o nounset amount workload 5 for i in seq amount workload do...

seq與Shell序列生成

有時候可能有這樣的需要 用shell生成類似0001這樣的序列作為批次號,這裡整理了一下個人的方法 seq命令可以生成從某個數字到遞增到另一數字的序列。用法如下 seq help usage seq 選項 尾數 or seq 選項 首數 尾數 or seq 選項 首數 增量值 尾數 print nu...

linux列印數字序列命令 seq

seq命令用於以指定增量從首數開始列印數字到尾數,即產生從某個數到另外乙個數之間的所有整數,並且可以對整數的格式 寬度 分割符號進行控制。seq 選項 引數 f,format 格式 使用printf 樣式的浮點格式 s,separator 字串 使用指定字串分隔數字 預設使用 n w,equal w...