bedtools不合格的使用介紹

2021-09-29 03:41:55 字數 1865 閱讀 3745

參考基因組表示的是一種座標系統,比如說某乙個物種基因組大小為100bp,那麼他參考基因組就可以表示為[1,100], 之後就可以用任意[x,y]表示這條參考基因組上的位置,這就是一種範圍資訊,x-y這段區域可能是外顯子,也可能是內含子,可能是編碼區,也可能是基因間區,也有可能是乙個測序結果。

因此range資料是生信資料比較常見的存放形式,比如說bed/bam/bcf/和gff/bff/sam/vcf/,前者以0為始,後者以1為始。

為了操作這種range資料,bioconductor在r語言中定義了兩個重要的物件,irange和genomicranges,後者僅存放'start','end','width'是後者的基礎。後者才能真正存放基因組range資料。

這一篇不介紹如何在r語言操作range資料,而是介紹bedtools這款號稱基因組range資料分析的瑞士軍當,當時的口號是一款取代10個生信分析師的工具。

bedtools能夠對基因組range資料進行計數等簡單操作,也能和unix命令列結合起來完成更加複雜的任務。

在正式介紹bedtools之前,需要先介紹一下bed格式。根據uscsc基因組瀏覽器的描述,bed格式能夠非常簡潔的表示基因組特徵和注釋,儘管bed格式描述中定義了12列,但是僅僅只有3列必須,因此bed格式按照列數繼續細分為bed3,bed4,bed5,bed6,bed12。

bed12定義的12列分別為:chrom, start, end, name(bed代表的特徵名),score(範圍為0~1000,可以是pvalue, 或者是字串,如"up"), strand(正負鏈), thickstart, thickednd(額外著色位置, 比如說表示外顯子), itemrgb(rgb顏色,如255,0,0), blockcount(區塊數量, 如外顯子), blocksizes(由逗號隔開的區塊大小), blockstarts(由逗號隔開的區塊起始位點)。

知道了bed12後,就可以對bed的細分格式進行舉例說明

bed12效果

除了官方的bed定義外,bedtools定義了bedpe用來表示基因組不連續的特徵,比如說結構變異或者雙端測序的reads。在定義中10列是必須的,為chrom11, start1, end1, chrom2, start2, end2, name, score, strand1, strand2。 這之後可以增加任意多的其他列。

其他bedtools支援的格式說明:

bedtools的功能非常強大,試**決你所遇到的所有和基因組位置運算的問題以及周邊問題:基因組運算,多檔案比較, pe資料操作,格式轉換, fasta資料操作, bam工具, 統計學相關工具,其他小工具

其中最重要的選項是--help,乙個強大的工具提供了許多引數,需要勤讀幫助文件。bedtools的官方文件寫的非常優秀,絕大部分工具都以**的方式形象的說明了每個引數的可能效果。因此我寫這篇文章的目的就是讓迫使自己去熟悉所有的工具而已。

所謂的基因組運算,就是看看看自己手頭拿到的區域和你感興趣的區域的關係如何。bedtools提供了如下工具做一系列你想到或者你想不到的事情。

集合運算:

區間統計:

區間工具:

bedtools的核心工具就是上面幾個,剩下的都算是小輪子,解決了你手上輪子不夠多的煩惱。

fasta相關:

bam格式相關:

pe檔案操作:

統計學工具:主要是用以不同的統計學方法來衡量兩個區間的相似度,有三種: jaccard, reldist, fisher

除了以上,還有一些更加有趣的小工具,比如說i**可以建立i**自動截圖的執行指令碼,links可以構建能在ucsc基因組上開啟的鏈結等。

投資機構 梅耶爾不合格 不合拍

梅耶爾在分析師會議上稱 雅虎的產品和資產組合太過複雜,特別是一些資產不再符合我們的積極增長目標或分心於增長產品,難以贏得使用者和廣告客戶的支援。她還表示,雅虎在研究 戰略性替代方案 雖然她未詳細說明,但這句話常常意味著一家公司想 自己。雅虎稱,2015年第四季度實現營收12.7億美元,同比增長1.6...

部落格數量不合格反思

在這個月的部落格檢查中,我的部落格數量及日期沒有達到符合的標準,一小部分原因是這個月請了一些假去看病,但是更大的原因是對部落格這方面沒有相當的重視,覺得寫部落格沒有那麼重要,沒有意識到寫部落格對於我的好處以及對現在以及未來的重要性,把它當做了一件不重要的小事來看待,忽略了要寫部落格。部落格不僅僅只是...

不合格的中層管理者

在公司中管理職從大的職位級別上分,一般分為基層管理者,中層管理,高層管理。而中層管理無疑是比較辛苦的。他是整個團隊的大管家,團隊中的方方面面都需要他去關注,去負責。初期他需要根據專案目標去進行整體的管理規劃。比如人員上的規劃,誰擔當什麼樣的角色。比如工作的分解,以及分解的工作什麼樣的角色來擔當。比如...