處理bam檔案提取資訊

2022-08-24 15:57:08 字數 571 閱讀 3609

一般來說,乙個bam檔案通常只包含乙個樣本的資訊,最多需要進行染色體位置的處理,samtools也提供了簡單的處理方式,比如要提取 chr1的reads, 只需要:

samtools view input.bam ch1

這幾天遇到了10x genomics的bam結果,發現單細胞的reads全包含在乙個bam檔案裡,用barcode進行區分,因此可能就需要提取其中的資訊,比如提起某乙個細胞的reads,那麼可以:

samtools view possorted_genome_bam.bam -h | sed -n "/^@\|tctgagaagaaaccat-1/p" | samtools view -b > result.bam

其實就是多了sed的處理過程 ,之所以加以記錄,是因為在處理過程中 

samtools -h

保留的header在將sam結果轉化會bam格式是必須的,以防下次忘記.

Pysam 處理bam檔案

pysam可用來處理bam檔案 安裝 用 pip 或者 conda即可 使用 pysam的函式有很多,主要的讀取函式有 一般常用的是第乙個和第二個。例子 1 import pysam 23 bf pysam.alignmentfile in.bam rb 其中r read,b binary.二進位制...

bam檔案讀取 bam格式檔案處理大全 一)

sam檔案是短序列比對生成的檔案,是二代測序中最核心的檔案。在rnaseq,變異檢測等分析中,都需要首先生成sam檔案格式。bam檔案是sam格式的二進位制格式,轉換為二進位制之後,可以減小檔案的儲存。掌握sam bam檔案的操作是處理二代測序資料的非常重要的內容,例如sam與bam的轉換,排序,建...

資料庫之提取資訊

sql語句最大的功能在於它可以提取資料。你可以以資料輸入到資料庫中的相同方式來提取資料,或者可以查詢資料庫,並獲得問題的答案。下面就簡單地介紹下資料庫的資訊提取。select語句,基本語法 select column1,column2,columnx from table name 如 select...