fastq資料質控過濾軟體 soapnuke 使用

2022-08-19 13:03:12 字數 2030 閱讀 5940

# 安裝2.0version 參照readme.md

for

2.x:

make

./soapnuke

--使用測試:

./soapnuke filter -1 /home_extend/u****/r/exam/newbgiseq500_1.fq.gz -2 /home_extend/u****/r/exam/newbgiseq500_2.fq.gz -c newbgiseq500_clean_1.fq.gz -d newbgiseq500_clean_2.fq,gz \

-l 10 -q 0.1 -n 0.01 -g 1 -q 2 -o /home_extend/u****/r/exam/cleandata

## -o 指定輸出目錄

--引數設定介紹:

soapnuke -1 path_to_fastq1 -2 path_to_fastq2 -t 4 -n 0.1 -l 5 -q 0.5 -q 2 -g -5

1 -o outdir -c path_to_cleanfastq1 -d path_to_cleanfastq2

# 引數說明

-t 執行緒

#adapter related:

-n, --nrate float n rate threshold [0.05

]-l, --lowqual int low quality threshold [5

]

-q, --qualrate float low quality rate [0.5

]

-q, --qualsys int quality system 1:illumina, 2:sanger[1],詳見-g 引數。

-g, --outqualsys out quality system 1:illumina, 2:sanger[1

],如果設定了就表示質量值體系選擇為phred33,預設是phred64。這個說明文件不是很清楚,

在soapnuke中sanger表示phred33,illumina表示phred64質量體系。之所以會這樣其實開發該軟體的歷史原因,在比較早期的時候,phred33和phred64這兩個詞用的還比較少。

開發人員知道的是sanger測序的質量值是ascii-33,而illumina的質量值要-64

(早期版本),因此為了好記,就直接用了這兩個詞,代表和sanger的一樣,或者和illumina的一樣;

這個引數和-q是有同樣的作用。-33的質量體系,使用-q 2 (或者 -g ,也可以兩個引數都使用)

-1, --fq1 file fq1 file

(required),read1的fasq檔案

-2, --fq2 file pe(雙端)測序時,需要read2的fastq檔案 ,即fastq2

-c, --cleanfq1 str clean fq1 file

name(required ,gz format)

-d, --cleanfq2 str clean fq2 file

name

-o, --outdir str 輸出目錄,預設當前目錄

-3, --maxreadlen int read max length,default 49

forfiltersrna

-4, --minreadlen int read min length,default 18

for filtersrna,30

for other modules

sra 資料轉成 fastq並改名

把sra資料移動到我們工作目錄後,我們開始sra轉faq。正式執行 之前,必須先拿乙個樣品測試下 能否執行成功,這點很關鍵,因為這步就算成功執行也特別慢,要是 再出錯了就更浪費時間了。ls srr5315196.sra fastq dump gzip split 3 o srr5315196.sra...

資料質控軟體Raspberry的安裝與使用

按github上的官方安裝說法,cmake時總是出錯,實在是不知道 有問題,在腦子不清醒的狀態下竟然一不小心 裝好了,以下是具體步驟 wget unzip master.zip cd raspberry master include judy 1.0.5 configure prefix raspb...

帆軟報表多源資料過濾為何不顯示資料

寫下來,給自己提個醒喔!昨天改個別人做的帆軟報表,資料來源來自於兩個資料庫 乙個oracle乙個sqlserver。在進行資料過濾的時候發現咋都出不來,以為是自己的過濾方法錯了,查了下官方文件關於過濾的,我的就兩個資料來源很簡單沒發現啥問題啊!但是為什麼出不來呢?是不是配置方面的問題?然後去查關於過...