利用seqtk處理序列檔案

2021-10-03 12:14:32 字數 837 閱讀 1460

1. fq檔案轉fa檔案

seqtk seq -a in.fq.gz > out.fa
2.把長型的fa或者fq檔案折貼(加回車變成多行),且刪除序列名中的注釋資訊

seqtk seq -cl60 in.fa > out.fa
3.把折貼型的fq檔案(多行顯示)轉換成長型的(標準4行)

seqtk seq -l0 in.fq > out.fq
4.反轉得到互補連

seqtk seq -r in.fq > out.fq
5.按照序列名抽提序列,每行1個名稱

seqtk subseq in.fq name.lst > out.fq
6.抽提還有序列片段(儲存在reg.bed檔案中)的序列

seqtk subseq in.fa reg.bed > out.fa
7.隨機抽平(雙端測序注意隨機種子設定一致,保證配對)

seqtk sample -s100 read1.fq 10000 > sub1.fq

seqtk sample -s100 read2.fq 10000 > sub2.fq

8.根據鹼基質量修剪序列

seqtk trimfq in.fq > out.fq
9.從左端(-b)或右端(-e)修剪一定數量鹼基

seqtk trimfq -b 5 -e 10 in.fa > out.fa

利用序列化進行檔案讀寫

在很多應用中我們需要對資料進行儲存,或是從介質上讀取資料,這就涉及到檔案的操作。我們可以利用各種檔案訪問方法完成這些工作,但mfc中也提供了一種讀寫檔案的簡單方法 序列化 序列化機制通過更高層次的介面功能向開發者提供了更利於使用和透明於位元組流的檔案操縱方法,舉乙個例來講你可以將乙個字串寫入檔案而不...

序列檔案 seq file 介面

內容簡介 本文主要講述序列檔案 seq file 介面的核心實現,如何使用它將linux核心裡面常用的資料結構通過檔案 主要關注proc檔案 匯出到使用者空間,最後定義了一些巨集以便於程式設計,減少重複 在分析序列檔案介面實現的過程中,還連帶涉及到一些應用陷阱和避免手段。序列檔案介面 unix的世界...

序列檔案 seq file 介面

內容簡介 本文主要講述序列檔案 seq file 介面的核心實現,如何使用它將linux核心裡面常用的資料結構通過檔案 主要關注proc檔案 匯出到使用者空間,最後定義了一些巨集以便於程式設計,減少重複 在分析序列檔案介面實現的過程中,還連帶涉及到一些應用陷阱和避免手段。序列檔案介面 unix的世界...