Circos軟體學習

2022-08-17 01:33:23 字數 3301 閱讀 9571

circos 是一款perl 語言開發的畫圖軟體,提供了染色體相關資料的一種視覺化方式。其製作的圖表精美,被科研工作者廣泛使用。circos可以對染色體相關資料進行視覺化,以每條染色體為乙個扇區,組成乙個圓形,如圖1所示。也可以對其他**形式的資料進行視覺化,以每個樣本作為扇區,以其上的特徵作為圖形層次。如圖2所示,可以以物種作為扇區,展示物種間的關係。circos圖最初以perl語言開發,後來又有一些r包被開發用來繪製circos圖。今天的學習主要學習perl開發的circos軟體。沒錯,下邊這兩個美圖都是circos的結果了。

圖1

圖21.circos軟體安裝

circos軟體由perl語言開發,所以使用circos之前需要安裝perl語言才能執行circos。在windows環境下推薦使用士多啤梨perl即strawberry perl,它的優勢是本身自帶了cpan,方便後續安裝perl的模組。

測試:circos提供了example,在example/etc路徑下有circos.conf檔案,執行命令為circos –conf circus.conf,執行此命令則會在該資料夾下生產circos.png和circos.svg,如圖3所示。如果正確出圖,則說明軟體安裝正確。

圖32.軟體說明

circos採用circos  –conf circos.conf的方式執行,其中circos.conf為配置檔案。circos.conf檔案中可以分為染色體配置和內圈圖形配置兩部分。染色體部分為圖形中最外圈的部分,為圖形的基本部分,該部分指定所需要繪製的染色體,扇區比例,每個扇區半徑大小等。內圈圖形部分指除了染色體外的其他圖形區域,在這部分需要使用進行限定。限定了所有的內圈圖形,每一層圖形需要再使用進行限定。

2.1circos.conf

染色體配置部分如圖4所示。karyotype指定染色體資料檔案;chromosomes_units指定染色體長度單位,需要注意的是,染色體長度需要大於chromosomes_units,否則染色體扇區之間會產生空缺;chromosomes_display_default指定是否顯示預設,預設狀態下展示檔案內所有染色體,顏色為黑色,每個扇區面積相等,且下邊對染色體的具體配置資訊不起作用;chromosomes指定要顯示的染色體;chromosomes_scale指每個扇區佔圓周的比例,例如chr1=0.5r,指染色體1佔圓周的一半。chromosomes_radius指每個扇區的半徑,指定不同的半徑,可以使圖形展示出發射或內陷的狀態,起到內容強調的作用;檔案中使用<<>>來指定需要呼叫的其他配置檔案,如<>指定染色體條帶的配置資訊。在circos.conf檔案中,缺省會出現<>、<>、<>、<> 、<>等,可以通過修改ideogram.conf和ticks.conf獲得想要的效果,其餘幾個檔案基本不用修改。

圖4內圈圖形配置內容使用限定,每個限定每一層的圖形,如圖5所示。其中type指定該層圖形所展示的圖形型別,如histogram展示了柱狀圖;file指定要畫圖的資料檔案,r1和r0分別指定圖形在圓圈內所佔的半徑範圍,如r1=0.97r,r0=0.88r,即該層柱狀圖會出現在0.88半徑到0.97半徑之間的位置;thickness指定柱狀圖邊框的寬度,0p指定不顯示邊框;orientation指定柱狀圖方向向內/向外;

圖52.2 ideogram.conf

該配置檔案對最外圈染色體進行配置,內容如圖6所示。設定內容由進行限定。設定了每個染色體條帶之間的間隔,設定的值為圓周的比例;radius設定染色體半徑佔整個圖形的比例,可以通過設定不同的radius對圖形進行縮放;thickness指定染色體圖形邊框的寬度;fill指定是否填充顏色;stroke_color設定刻度顏色;stroke_thickness設定刻度寬度;show_ticks設定是否顯示刻度;show_label是否顯示標籤,即每個染色體的名字;label_font、label_radius、label_size分布顯示染色體名稱的字型,位置,大小等;label_parallel指定染色體名稱是否與染色體條帶平行。

圖6資料檔案同樣分為外圈染色體資料和內圈圖形資料。外圈染色體資料基本格式如圖7所示。其中第三列、第四列、第七列為染色體名稱,第五列和第六列為該染色體長度,該長度在展示的時候會根據設定的單位長度進行刻度標註。

圖7內圈圖形資料會根據不同的圖形型別有不同的格式,在此以柱狀圖和標註文字,即type= histogram和type=text為例。柱狀圖的資料檔案如圖8所示。第一列為染色體名稱;第二列和第三列為柱子展示區間;第四列為柱子高度;第五列為柱子顏色。該資料展示的是在每個染色體對應三個柱子,每個柱子區間分別為0-300000,300001-600000,600001-100000。

圖8標註文字的資料檔案格式如圖9所示。第一列為染色體名稱,第二列和第四列為文字位置,第四列為文字內容。

圖9軟體有一套自己的顏色系統,顏色及對應的名稱在解壓後的資料夾內,檔案名字為gddiag.png,內容如圖10所示。該檔案給出了可以使用的顏色,沒以後有乙個名字,對應乙個系列,每行又有多個子系列。可以用指定行名和子系列的方式使用顏色,例如rdylbu-3-div-3,指rdylbu- div所對應的行的第三個子系列的第三個顏色。知道了顏色及使用方式就可以在配置檔案或資料檔案中對圖形設定不同的顏色了。

圖10在本次學習中使用乙個snp相關的資料進行展示,分別對不同的檔案進行配置,並進行繪圖,繪圖結果如圖11所示。

圖11

circos使用記錄 win7

本來是想要做出來這種效果的圖,然後在乙個r語言群裡面問到用這個可以做出來 安裝安了很長時間,大概加除錯有三個小時,反正具體怎麼安裝我就不說了,推薦博文 然後安裝好之後進入命令列模式 perl v然後應該是下面的樣子,win10有點問題,我在win7上裝的 需要安裝的模組 config general...

MATLAB 軟體學習

what 列出當前目錄或指定目錄下的m mat 和 max 檔案 在語句行尾端表示該行未完 呼叫作業系統的命令 isvarname 判斷變數名是否有效 宣告全域性變數 變數名前加 global whos 檢視資料的型別 函式控制代碼型別 fhandle functionname fhandle 指標...

maple軟體 maple軟體使用學習

目錄如何化簡公式 怎麼隱藏計算結果 矩陣rotx theta matrix 1,0,0,0 0,c theta s theta 0 0,s theta c theta 0 0,0,0,1 矩陣的逆 t simplify collect expand a 1 a 2 a 3 a 4 a 5 a 6,t...