單端測序與雙末端測序問題

2021-10-14 10:04:57 字數 2933 閱讀 2701

一圖看區別:

總的來講就是單端測序只從一側讀,而雙端測序是兩頭同時讀然後拼接

single-read測序(single-read)首先將dna樣本進行片段化處理形成200-500bp的片段,引物序列連線到dn**段的一端,然後末端加上接頭,將片段固定在flow cell上生成dna簇,上機測序單端讀取序列。該方式建庫簡單,操作步驟少,常用於小基因組、轉錄組、巨集基因組測序。

測序的質量會隨著測序的進行而下降,所以 reads 約往後面越不準確,單端測序下游質量會很差,所以就引入了雙端測序可以大大提高測序的準確率。

通過構建paired-end文庫製備,指在構建待測dna文庫時在兩端的接頭上都加上測序引物結合位點,在第一輪測序完成後,去除第一輪測序的模板鏈,用對讀測序模組(paired-end module)引導互補鏈在原位置再生和擴增,以達到第二輪測序所用的模板量,進行第二輪互補鏈的合成測序。

文庫結構示例:

1. 為了兩個方向上分別進行測序,就需要有兩個不同方向的測序引物(下圖 rd1 sp 和 rd2 sp);

2. 為了區分兩個方向的 reads,其中乙個測序引物前面要新增一小段 index 序列進行標記。

雙端測序流程示例:

single-read測序、paired-end和mate-pair主要區別

以上三者的區別主要在於測序文庫的構建方法上。

single-read測序(single-read)首先將dna樣本進行片段化處理形成200-500bp的片段,引物序列連線到dn**段的一端,然後末端加上接頭,將片段固定在

flow cell上生成dna簇,上機測序單端讀取序列。該方式建庫簡單,操作步驟少,常用於小基因組、轉錄組、巨集基因組測序。

paired-end文庫製備是指在構建待測dna文庫時在兩端的接頭上都加上測序引物結合位點,在第一輪測序完成後,去除第一輪測序的模板鏈,用對讀測序模組(paired-end module)引導互補鏈在原位置再生和擴增,以達到第二輪測序所用的模板量,進行第二輪互補鏈的合成測序。

mate-pair文庫製備旨在生成一些短的dn**段,這些片段包含基因組中較大跨度(2-10 kb)片段兩端的序列,更具體地說:首先將基因組dna隨機打斷到特定大小(2-10 kb範圍可選);然後經末端修復,生物素標記和環化等實驗步驟後,再把環化後的dna分子打斷成400-600 bp的片段並通過帶有鏈親和黴素的磁珠把那些帶有生物素標記的片段捕獲。這些捕獲的片段再經末端修飾和加上特定接頭後建成mate-pair文庫,然後上機測序。

為何要有 paired-end這樣的技術發明呢?

主要原因在於illumina的二代測序儀的讀長短,相對於第一代sanger測序法(約1000bp)或者跟同屬於ngs的其他測序儀相比短了許多。因此illumina發展了 paired-end的建庫測序技術。同時這種技術還大大推進了基因組學資料分析的發展。

例如,依賴於paired-end的技術,假設乙個dn**段剛好跨越了重複序列區域(下圖左側)以及獨特序列區域(下圖右側)。加入只讀取single-read,我們只會獲得紅色實線的序列資訊,也就是atatatat。接下來,當我們想要將這段read跟reference genome做比對的時候,便會出現問題:到底這段read是出自於紅色實線的位置,還是紅色虛線的位置?這個問題我們就可以使用paired-end的技術來加以解決。由於paired-end reads之間的距離為已知(在此我們設為34bp),我們便可以先定位綠色read的位置,在正確定位出左邊紅色re reads之間 ad的位置,而不至於將其誤判在紅色虛線的位置。如下圖所示:

此外,根據我們內部的乙個測試。在進行de novo assembly的時候,序列長度以及paired-end的序列資訊可以讓我們得到最好的組裝結果。透過下邊可以發現,paired-end的序列資訊甚至比序列長度要來得更為重要。因此,建議大家在選擇測序方案的時候,盡量選擇paired-end吧!

總結,不管採用哪種方式,pe/mp測序的結果除了序列本身外還有中間的距離資訊。距離資訊可以用來判定組裝後成對reads間的序列是否準確,也可用來幫助組裝。這種測序方式可以用來解決基因組中的重複序列難題,被廣泛採用。目前在採用雙端測序法時,454平台建庫最長(最長能達到20k),illumina 建庫長度最短(小於5k)。由於solid和solexa都是採用橋式擴增的方式,其本身自帶paired-end測序能力。而454和ion torrent要對打斷後的片段進行環化、酶切,然後才能進行 mate-paired 測序。因此建庫的成本會比單端測序的高 。

paired-end reads是如何比對的?

paired-end reads是如何拼接的?

與 , 與 的不同(單雙與單雙或)

邏輯運算 1.與運算分為普通與 和短路與 兩種 普通與 所有的判斷條件都要判斷.短路與 如果前面的判斷返回了false,那麼後面不再判斷,最終結果就是false.2.或運算分為普通或 和短路 或兩種 普通或 所有的判斷條件都要判斷.短路或 如果前面的判斷返回了true,那麼後面不再判斷,最終結果就是...

單鏈表與雙鏈表佇列

一,鍊錶分類 單鏈表與雙向鍊錶 三,定義類 1 node類 傳值與重寫get,set方法 2 linknodelist類 將對資料的增刪差改的基本操作方法或屬性 3 main 主函式類,進行資料的呼叫 四,單鏈表的示例 public class linklistnode else 設定新節點為最後乙...

C 單問號( )與雙問號( )

1.單問號 1.1 單問號運算子可以表示 可為null型別,c 2.0裡面實現了nullable資料型別 a.比如下面一句,直接定義int為null是錯誤的,錯誤提示為無法將null轉化成int,因為後者是不可以為null的值型別。private int getnum null b.如果修改為下面的...