生物資訊 SOAPalign 引數設定

2021-06-06 05:04:09 字數 1287 閱讀 3523

生物資訊_soapalign_引數設定_例子

跑soapalign之前要建庫

/dir/2bwt-builder

注:會得到一堆的.index檔案,.index指代建庫產生的一系列檔案

soapalign

例:/dir/soap -d .index -t -l 35 -v 4 -m 28 -x 481 -g 1 -p 4 –a pe_1.fq.gz -b pe_2.fq.gz -o/outfile/pe.soap -2 /outfile/pe.single -u /outfile/pe.unmap 2>>/outfile/soap.log

-d .index

接建庫以後的index,也就是處理後的ref

-t輸出reads的id而不是輸出reads的name

-l 《數字》

對於長reads的3'端有高的錯誤率,因此不能完全比對上去,優先考慮比對5'端的這麼多《數字》bp的鹼基作為種子。如果設定

為256,那就是用read的全長。

-v 《數字》

一條reads內允許的mismatch數

-m 《數字》

最小insert size的長度,針對pe的

-x 《數字》

最大insert size的長度,針對pe的

-g 《數字》

允許gap的數目

-p 《數字》

執行緒數,越大越快撒

-a 接pe結果1

-b 接pe結果2

-o 輸出alignment的結果

-2 輸出比對上的但是不成對的結果。

-u 輸出比對不上的結果

例:/dir/soap -v 5 -l 35 -s 40 -m 0 -x 500 -p 4 -r 1 -n 0 -d .index -a pe_1.fq.gz -b pe_2.fq.gz -o/outfile/pe.soap -2 /outfile/pe.single -u /outfile/pe.unmap

-s 《數字》

最小比對上的長度

-m 《數字》

最小insert size的長度,這裡設為0

-r 《數字》

數字為1的時候repeat hits輸出隨機的乙個,0就是乙個都不輸出,2就是輸出全部

-n 《數字》

比對前過濾含大於《數字》個n的reads

生物資訊 Call snp by soapsnp

生物資訊 call snp by soapsnp 全基因組 資料 人全基因組 100多g,兩個gz檔案,已去接頭,pe測序,90讀長 方法 call snp by soapsnp 每步估計需要投多大 僅作參考 bwa 13g 從兩個clean.fq.gz到兩個.sai再到乙個.sam 注 在生成完s...

生物資訊 related

生物資訊學的研究重點主要體現在基因組學 genomics 和蛋白質組學 proteomics 兩個方面,intron 內含子,exon外顯子 雙螺旋結構是基於對鹼基配對規律的認識 氫鍵結合只發生於互補的鹼基a與t g與c之間。雙螺旋分子兩條鏈的嚴格互補性,是指一條鏈的核苷酸順序,無例外地取決於另一條...

生物資訊學軟體 自學生物資訊學

我是生物工程專業出身,在大三保研時選擇了生物資訊的道路,到現在為止已經在行業裡摸爬滾打了6年的時間,在這6年的學習之路上疑惑過,也迷茫過,特此把我學習的過程以及遇到的問題總結出來以讓大家避免出現同樣的問題。在我學習生物資訊過程的基礎上帶著大家順暢的走一遍。在學習生物資訊學之前,我們先來了解一下什麼是...