conda 安裝指定路徑 HiCPro安裝與使用

2021-10-13 20:41:47 字數 3355 閱讀 2607

hic-pro可以用來處理hi-c資料,從原始的fastq檔案(illumina資料)到標準化的互動圖譜。簡單的來說就是將hi-c資料比對到拼裝好的參考基因組上,並形成互動檔案去儲存hi-c資料。下面我們就來介紹一下hic-pro的安裝與使用。

python版本為2.7

conda create -n hicpro python=2.7  #強烈推薦安裝乙個新的環境conda install -y samtools bowtie2 rconda install -y pysam bx-python numpy scipy
在當前conda環境下執行r

也可以絕對路徑執行r

rinstall.packages(c('ggplot2','rcolorbrewer'))
prefix軟體安裝路徑,會在該路徑建立乙個hic-pro_2.11.1目錄

r_path指定conda環境下的r

python_path指定conda環境下的python

cluster_syscluster_sys集群排程系統為torque,sge,slurm,lsf四個中的一種

這些路徑可以which+對應的依賴(如: which bowtie2)獲得

配置檔案修改完成之後執行下列指令即可完成安裝

make configuremake install
1.1資料夾的建立

建議建立兩個資料夾命名為sample.readssample.ref(sample為自己的物種名字即可,下面以亞洲棉ga為例)

1.2ga.reads的的目錄結構

目錄結構如下(依據自己的研究修改物種名即可,ga_1、ga_2...為不同的生物學重複)

1.3ga.ref的相關檔案

建立索引 (索引的命名為物種名)

/path/to/bowtie2-build --threads 20 /ga.ref/ga.fasta /ga.ref/ga
1.4酶切資訊檔案的獲得

採用hic-pro自帶的digest_genome.py程式酶切位點資訊檔案

/path/to/hic-pro_2.11.1/bin/utils/digest_genome.py -r hindiii -o ga.hindiii.txt /ga.ref/ga.fasta#-r指定酶的名稱或者序列(如下圖)#-o指定酶切資訊檔案的輸出目錄#最後的fasta檔案是組裝的參考基因組

1.5基因組中序列大小檔案

序列大小檔案格式如下 contig1[tab]contig1_length

可以用如下指令獲得

samtools faidx /ga.ref/ga.fasta && awk '' /path/to/ga.fasta.fai > ga.fasta.size #注意生成的.fai在.fasta檔案所在的目錄下面
至此,相關檔案的準備就結束了。

首先將配置檔案複製乙份到當前目錄下

cp /path/to/hic-pro_2.11.1/config-hicpro.txt .
然後,進行修改(以下為通常需要修改的引數,其他的引數的修改請參考官網)

# n_cpu,例如n_cpu = 24# job_name,例如job_name = ga# job_walltime,例如job_walltime = 11:00:00# job_queue,例如job_queue = normal# job_mail,例如job_mail = [email protected]# bowtie2_idx_path填寫用bowtie2對reference建立索引的目錄,注意是目錄,而不是索引路徑!如/path/to/ga.ref# reference_genome,例如ga 注意:這裡reference_genome一定要和bowtie2建立的索引對應上,名字為物種名# genome_size,即生成的檔案ga.fasta.size(最好使用絕對路徑)# genome_fragment,用digest_genome.py程式生成的檔案ga.hindiii.txt# ligation_site,酶的序列,例如hindiii,則為aagctagctt;如果是mboi則序列為gatcgatc。# min_frag_size,例如min_frag_size = 100# max_frag_size,例如max_frag_size = 160000# min_insert_size,例如min_insert_size = 200# max_insert_size,例如max_insert_size = 600# get_process_sam,例如get_process_sam = 1
hic-pro的使用很簡單,主要就是三個引數,指令如下(單執行緒執行)

/path/to/hic-pro_2.11.1/bin/hic-pro --input ga.reads --output hicpro_output --conf config-hicpro.txt # --input reads所在的檔案# --output 輸出的資料夾# --conf 配置檔案
如果想多執行緒執行,要加上-p引數,輸入指令後會在輸出檔案中生成兩個檔案hicpro_step1.shhicpro_step2.sh。先執行step1,step1執行完成後,再執行step2即可。

軟體官網:

如果你也想加入我們,為發布優質的內容而貢獻自己的力量,

歡迎fork我們github上的團隊倉庫。

github倉庫:

hexo網頁:  

conda 安裝指定路徑 conda簡介和安裝使用

conda簡介 conda 是為 python 程式建立的多平台打包和分發軟體,conda 是乙個開源的軟體包管理系統和環境管理系統,用於安裝多個版本的軟體包及其依賴關係,並在它們之間輕鬆切換。conda分為anaconda和miniconda。anaconda包含常用包的版本,miniconda是...

安裝 指定版本 conda 安裝指定版本的指定包

tuna 還提供了 anaconda 倉庫的映象,執行以下命令 conda config add channels conda config set show channel urls yes 即可新增 anaconda python 免費倉庫。中科大的映象 conda config add cha...

conda指定路徑 conda 常用命令合集

檢視環境 conda env list 建立環境 conda create n python36 python 3.6 進入環境 source activate python36 activate python36 windows下 搜尋包conda search mxnet 指定環境,檢視已安裝的...