三代測序組裝工具Canu學習筆記

2021-09-12 19:32:01 字數 3621 閱讀 9152

canu是celera的繼任者,能用於組裝pacbio和nanopore兩家公司得到的測序結果。

canu分為三個步驟:糾錯,修整和組裝。

wget -c -o pacbio.fastq

wget -c -o oxford.fasta

為了測試方便,這裡沒有從 canu 的原始碼編譯,而是直接使用的 docker 容器來測試。

為了從 quay.io 獲取 canu 映象,需要先註冊乙個賬號,註冊比較簡單,就是填個**就行了。

sudo docker login quay.io

sudo docker pull quay.io/biocontainers/canu:1.7.1--pl526h470a237_0

sudo docker run -it --rm -v `

pwd`

:/canu quay.io/biocontainers/canu:1.7.1--pl526h470a237_0 bash

糾錯
canu -correct \

-p ecoli -d ecoli-pacbio \

corthreads=32 coroutcoverage=120 cormincoverage=2 \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

-pacbio-raw pacbio.fastq

修整
canu -trim \

-p ecoli -d ecoli-pacbio \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

-pacbio-corrected ecoli-pacbio/ecoli.correctedreads.fasta.gz

組裝
canu -assemble \

-p ecoli -d ecoli-pacbio \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

correctederrorrate=0.050 \

-pacbio-corrected ecoli-pacbio/ecoli.trimmedreads.fasta.gz

糾錯
canu -correct \

-p ecoli -d ecoli-oxford \

corthreads=32 coroutcoverage=120 cormincoverage=2 \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

-nanopore-raw oxford.fasta

修整
canu -trim \

-p ecoli -d ecoli-oxford \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

-nanopore-corrected ecoli-oxford/ecoli.correctedreads.fasta.gz

組裝
canu -assemble \

-p ecoli -d ecoli-oxford \

gnuplottested=true \

genomesize=120m minreadlength=2000 minoverlaplength=500 \

maxmemory=500g maxthreads=32 \

ovsmemory=1-32g ovsthreads=16 ovsconcurrency=16 \

ovbmemory=1g ovbconcurrency=16 oeathreads=16 \

correctederrorrate=0.050 \

-nanopore-corrected ecoli-oxford/ecoli.trimmedreads.fasta.gz

spec 檔案

建立乙個 spec 檔案,比如:myspec.txt,內容如下:

usegrid=1

gridoptions=-s /bin/bash -q all.q -l mem_free=32g

gridenginethreadsoption=-pe mpi threads

gridenginememoryoption=-l mem_total=memory

ovbmemory=8g

maxmemory=64g

maxthreads=32

ovsmemory=8-64g

ovsthreads=4

oeathreads=4

使用 spec 檔案測試
# 使用 pacbio 資料測試

canu -s myspec.txt -p ecoli -d ecoli-pacbio gnuplottested=true genomesize=120m -pacbio-raw pacbio.fastq

# 使用 oxford nanopore 資料測試

canu -s myspec.txt -p ecoli -d ecoli-oxford gnuplottested=true genomesize=120m -nanopore-raw oxford.fasta

三代組裝 使用Canu對三代測序進行基因組組裝

canu是celera的繼任者,能用於組裝pacbio和nanopore兩家公司得到的測序結果。canu分為三個步驟,糾錯,修整和組裝,每一步都差不多是如下幾個步驟 這三步可以分開執行,既可以用canu糾錯後結果作為其他組裝軟體的輸入,也可以將其他軟體的糾錯結果作為canu的輸入,因此下面分別執行這...

使用Canu對三代測序進行基因組組裝

canu是celera的繼任者,能用於組裝pacbio和nanopore兩家公司得到的測序結果。canu分為三個步驟,糾錯,修整和組裝,每一步都差不多是如下幾個步驟 這三步可以分開執行,既可以用canu糾錯後結果作為其他組裝軟體的輸入,也可以將其他軟體的糾錯結果作為canu的輸入,因此下面分別執行這...

震網三代利用

筆者在最近想了個問題,學校機房關閉進不去,然後教師機子無ip如何黑入,而且不在同乙個網段下面,如何入侵呢,於是看到了一篇關於隔離網路攻擊的文章。想到了一年前乙個漏洞,於是測試開始。首先我們來了解一下 震網三代 環境 ubuntu16.04 vmware14 and win7 x64 msf首先我們開...