bam檔案格式說明

2022-06-23 21:27:11 字數 1487 閱讀 7997

`1. 序列是一對序列中的一個`

`2. 比對結果是一個pair-end比對的末端`

`4. 沒有找到位點`

`8. 這個序列是pair中的一個但是沒有找到位點`

`16. 在這個比對上的位點,序列與參考序列反向互補`

`32. 這個序列在pair-end中的的mate序列與參考序列反響互補`

`64. 序列是 mate 1`

`128. 序列是 mate 2`

假如說標記為以上列舉出的數目,就可以直接推斷出匹配的情況。假如說標記不是以上列舉出的數字,比如說83=(64+16+2+1),就是這幾種情況值和,可以使用二進位制數來表示

3參考序列的名字

4在參考序列上的位置

5q值的計算方法來自與sam標準格式,請檢視sam總結。

6代表比對結果的cigar字串,如37m1d2m1i,這段字元的意思是37個匹配,1個參考序列上的刪除,2個匹配,1個參考序列上的插入。m代表的是alignment match(可以是錯配),可以理解為表示比對的具體情況

7mate 序列所在參考序列的名稱,mate一般指大的片段序列

8mate 序列在參考序列上的位置

9估計出的片段的長度,當mate 序列位於本序列上游時該值為負值。

10read的序列

11read序列對應的ascii碼格式的鹼基質量值

12可選的區域 header section

其中header section用不同的tag表示不同的資訊,主要有@hd,說明符合標準的版本、對比序列的排列順序@sq,參考序列說明@rg,比對上的序列(read)說明@pg,使用的程式說明@co,任意的說明資訊。tag以鍵值對的形式存在。

as:i 匹配的得分

xs:i 第二好的匹配的得分

ys:i mate 序列匹配的得分

xn:i 在參考序列上模糊鹼基的個數

xm:i 錯配的個數

xo:i gap open的個數

xg:i gap 延伸的個數

nm:i 經過編輯的序列

yf:i 說明為什麼這個序列被過濾的字串

yt:z

md:z? 代表序列和參考序列錯配的字串

專案開發文件格式

在專案開發過程中,應該按要求編寫好十三種文件,文件編制要求具有針對性 精確性 清晰性 完整性 靈活性 可追溯性 。 可行性分析報告 說明該軟...

XML系列 XML文件格式 一

xml文件的的分類 1 格式不良好的 malformed 的xml文件 完全沒有遵循xml文件的基本規範的xml文件。 2 格式良好 well formed 但無效的xml文件 遵守了xml的基本規範,但沒有使用dtd或schema定義語義約束的xml文件。 3 有效 valid 的xml文件 遵守...

Vs巨集 之 整理HTML文件格式

有時從其它html編輯器得到的 html 是非標準的。一些標籤沒有閉合。不影響功能,但vs會提示不正確,而且,不能正常的縮排。如 input...