使用ROSE尋找超級增強子

2021-08-07 19:36:15 字數 3728 閱讀 8823

rose(rank ordering of super-enhancers)是麻省理工學院richard a. young實驗室開發的一種通過bam檔案及gff檔案尋找enhancer及其相關基因的工具,此工具由python編寫。專案主頁:

rose依賴軟體有:python 2.7.3, r 2.15.3, 和 samtools 0.1.18,因此在安裝rose前,首先確保伺服器上安裝了這三個工具。關於這三個工具的安裝,可以檢視這篇博文: rna-seq分析伺服器安裝生信工具過程。

rose安裝方式見以下**:

wget 

unzip 1a9bb86b5464.zip

# 解壓後檔案見下圖,可以直接通過python *.py呼叫工具

# 引數解釋

-g refseq參考基因組

-i 輸入gff檔案,一般為使用macs鑑定得到的med1富集區域(gff具體格式下文介紹)

-r 排序後的bam檔案,同時需為bam新增index

-o 輸出檔案目錄

#可選引數

-s stitching_distance,合併兩個region的最大距離,預設值為12.5kb

-t tss_exclusion_zone_size,排除tss區域大小,排除與tss前後某距離內的區域,以排除啟動子偏差(預設值:0;推薦值:2500)。如果設定該值為0,將不會查詢基因。

-c control_bam,control樣本的bam檔案

輸入檔案格式要求:bam檔案格式要求:需要排序和構建index(samtools可以操作),bam檔案的染色體id需要以chr開頭。

gff檔案格式要求:gff檔案必須有以下列

1.染色體位置(chr#)

2.每個增強子區域的特定id

4.區域起始位置

5.區域終止位置

7.正負鏈資訊(+, -, .)

gff格式參考:

rose也有轉換bam為gff的工具,在執行rose_mian.py時,會呼叫rose_bamtogff.py

rose_main.py執行例項:

python $soft_path/rose_main.py -g hg38 -i $work_path/gtf/kyse510_peaks.bed \

-r $work_path/samtools_sort/sort_treat1.bam -c $work_path/samtools_sort/sort_control1.bam \

-o $work_path/rose/kyse510 -s

12500 -t 2000

2>$log_path/kyse510_enhancer.log

其中,更多基因組可以從獲取儲存到rose的annotation資料夾,但是需要注意修改相應rose_mian.py的相應**。

輸出檔案如下:

1.**output_directory/gff/*.gtf該檔案為輸入gtf檔案的副本;

2.**output_directory/gff/*stitched*.gtf該檔案為通過在stitching_distance將input_constituent_gff拼接在一起建立的gff檔案;檔案列數如下:

chrom, name, [blank], start, end, [blank], [blank], strand, [blank], [blank], name

其中name欄位的命名方式為:拼接起來的區域數+最左端區域id。

5.**output_directory/stitched_enhancer_region_map.txtbamtogff計算後得到的拼接增強子密度檔案,包含以下列:

(拼接增強子id,染色體,拼接增強子起始位置,拼接增強子末端位置,拼接數,bam訊號等級,bam訊號)

6..**output_directory/*_allenhancers.table.txt增強子列表,包含每個增強子的排名和是否為超級增強子,包含以下列:

(增強子id,染色體,拼接增強子起始位點,拼接增強子末端,拼接數,拼接成分大小,bam的訊號,bam的等級,是否為超增強子:是(1)否(0))

7.**output_directory/* _superenhancers.table.txt超級增強子的排名,為*_allenhancers.table.txt檔案的子集。包含以下列:

(拼接增強劑id,染色體,拼接增強子起始位點,拼接增強子末端,拼接數,縫合在一起的成分的大小,ranking_bam的訊號,ranking_bam的等級,超增強子的二進位制(1)與典型(0))

8.**output_directory/*_enhancers_withsuper.bed可以載入到ucsc瀏覽器中視覺化的增強子bed檔案

9.**output_directory/*_plot_points.png所有增強子散點圖,如下圖:

# 引數解釋

-i input 輸入rose_mian.py生成的enhancer table檔案

-g genome 輸入genome資訊(mm9,mm8,hg18,hg19等)

-o out 輸出路徑

# 可選引數

-l genelist 要過濾的基因列表

-w window 搜尋基因距離,預設值為50,000bp

-f format 如果使用此引數,將保持原輸入檔案格式輸出

-g hg38 -o $work_path/rose/te7 2>$log_path/te7_enhancer_anno.log

輸出檔案如下:

1.**output_directory/*enhancer_to_gene.txtenhancer重疊基因、附近基因以及最近的基因列表

2.**output_directory/*gene_to_enhancer.txt以每個基因為列名的和其相關的增強子位置資訊列表

得到這兩個**即可對基因進行篩選然後進行go及kegg分析等。

下圖是執行兩工具的結果截圖:

超級右鍵 滑鼠增強神器iRightMouse

如果你是多年的windows使用者轉到macos平台,你必定會發現windows上很多非常方便的滑鼠右鍵選單在macos上都是沒有的,例如新建txt文件 一鍵隱藏檔案等。而這些快捷功能的缺失也確實會帶來一些不便,最近發現一款非常實用的右鍵增強工具,可以解決你的煩惱。首次開啟超級右鍵,需要在 設定 拓...

對rose框架的簡單使用

剛到一家新公司,要求使用rose框架,就了解學習了一下。首先,rose是一款人人網開源的遵循約定優於配置的原則的j2ee框架。在使用時,它的控制器必須以controller結尾,放在 controolers的包下,dao則是以dao接的介面。如圖 以denocontroller為例 path dem...

超級右鍵 Mac電腦的滑鼠增強工具

超級右鍵 滑鼠增強神器irightmouse 詳細介紹了超級右鍵的新建檔案 終端裡進入路徑功能 超級右鍵 mac右鍵擴充套件工具 介紹了下面看看超級右鍵的個性化檔案圖示 翻譯等功能 功能1 複製 發動檔案到指定路徑 參考windows 傳送到 右鍵選單,超級右鍵提供了自定義傳送檔案到特定路徑的功能。...