PacBio單分子長測序

2021-09-27 22:22:15 字數 2991 閱讀 6522

pacbio是目前測序長度最長的測序方法----平均讀長達到8kb。

原理:1. 用4種螢光分別標記4種dntp

2. 在測序晶元的底部做出許多用與入射光波長相應的小孔,特定的孔徑保證了入射光在小孔中只以走很短的矩離。只夠照到正好與酶在相互作用的螢光dntp底物

3. 把聚合酶錨定在測序晶元的底部

4. 讓dna鏈與酶結合,進行測序

5. 測序時,螢光dntp與酶+dna模板型成複合物,短暫結合

6. 螢光dntp被雷射照射,發出螢光,螢光被檢測到

7. 酶反應過程,一方面使鏈延伸,同時使dntp上的螢光基團脫落

8. 聚合反應持續進行,測序同時持繼進行

優點:1. 測長很長,主力的測長可以達到8kb,見下圖

2. 可以直接測出鹼基修飾,當聚合酶遇到模板上甲基化的a、c等鹼基時,聚合的速度明顯變慢,並且光譜特徵發生改變。這使直接測甲基化變得很容易,見下圖:

3. 對gc含量的偏向性小,可以輕鬆讀到高gc的區段,下圖中的紫色曲線就是pacbio的覆蓋度。從本質上說,是因為建庫中沒有pcr過程,所以也就沒有因為pcr而引入的gc bias

4. 測序速度快,上機時,1秒鐘測3個鹼基。3個小時可以完成乙個run。上機前的建庫,1天完成,與illumina或ion torrent的建庫時間基本持平。所以,整體上,1天建庫,1天上機,1天資料分析,3天可以走完乙個完整流程

缺點:鹼基的錯誤率:還是很高,達到12~15%。

錯誤的型別:主要是額外插入鹼基,同聚物(一串多個a、或c、或g、或t)區段尤其嚴重

錯誤的原因是:以讀a鹼基為例,軟體判斷是乙個a,還是二個a,是通過時間長短來確定的。而聚合酶與dntp結合的時間是呈指數遞減分布的,也就是半衰分布。所以判斷不准。當遇到同聚物時,軟體就更算不准,插入鹼基的可能性就會增加

錯誤的特點:隨機錯誤

錯誤的修正:因為是隨機錯誤,所以測序深度增加後,可以通過統計來修正錯誤。 另外,可以用illumina平台的高準確度序列來校正pacbio的序列

應用:de novo,因為讀長很長,所以在拼contig時,成功率很高,可以拼出很長的contig。並且可以輕鬆跨過重複序列、高gc序列。實際應用中,大家普遍用pacbio序列拼contig,再用illumina的序列來修正鹼基

hla分型,人體器官移植中,準確的hla分型很重要。hla是乙個長片段,而且單體型對配型成功、移植成功有重要意義。現在醫學上正在嘗試用pacbio的序列來為hla準確分型提供解決方案

甲基化研究。bisulfite是目前最常用的c鹼基的甲基化研究手段,但是操作很複雜、後續檢測也不算方便。pacbio可以直接讀出多種鹼基修飾,包括a的甲基化、c的甲基化、c的羥甲基化等,所以pacbio在鹼基修飾研究中,有著獨特的優勢

rna可變剪接研究。分析rna可變剪接的前提是乙個讀長序列要跨過可變剪接位點的兩側,而現有的別的測序方法,因為讀長較短,所以對rna可變剪接並不是很敏感。pacbio正好補上了這一塊,所以有一些專家在用pacbio研究可變剪接

檢測多個重複序列。有些疾病是因為一些重複序列的重複次數超過了正常的範圍,如脆性x-gene病中高達750個cgg重複,以往這些序列是很難通過直接測序測清楚的,現在科學家可以用pacbio直接測這些區段了

未來的發展方向:

更長的讀長

目前限制讀長的因素是:a.文庫發生切口,或都斷掉,導致模板鏈從酶上脫落;b.酶在雷射照射和螢光基因的作用下失活。

所以,未來要做更長的讀長: a.建立更長、更完整的文庫構建方法。b.或者採用合成效率更高的酶,讓單位時間內可以合成更多的鹼基;或者採用更耐雷射、螢光基團侵襲的酶;或者採用更好的螢光基因,有更好的螢光效率,以減少入射的雷射強度

更大的測序通量

目前的乙個smrt晶元約可以給出5萬條有用的reads,並得到約0.4g的有效資料量。

目前,總共是15個孔,酶落入孔中的分布呈泊松分布,約1/3的空孔,1/3的單個酶孔,1/3的多個酶孔;其中只有單個酶孔所產生的資料是有用資料

未來,pacbio會在增大每個smrt晶元的通量(read數)上下功夫

文庫形狀:

pacbio的文庫形狀很有趣,是乙個環,中間是測序插入片段,兩端是髮夾形的接頭,見下圖:

好處:可以周而復始地測序,充分利用pacbio的讀長

插入序列的正向鏈和反向鏈都可以被讀到,起到自我校正作用

兩端的已知接頭序列,可以用作計數器,用於計算模板被周而復始地測了幾次

國內服務費用:

建庫,試劑約¥4000,外包公司的建庫服務**約為¥8000~10000

上機,smrt測序晶元約¥4000,外包公司的服務**約為¥6000~8000

國內有pacbio的機構:

1. 中科院遺傳所

2. 醫科院北京藥植所

3. 上海南方基因中心(有公開服務)

4. 雲南動物所

5. 武漢鄧子新教授實驗室

6. 天津生物晶元中心(有公開服務)

7. 北京海克威爾公司

國際上提供pacbio服務的機構:

1. broad中心,乙個smrt run,賣$2500

單測 JUnit搭配PowerMock單測實踐

單元測試是要遵守可重複執行,故測試用例不應該依賴外部環境以及下游服務,避免不必要的問題 mock工具就是為了滿足這一需求的,它可以幫我們mock 模仿 出外部依賴物件,這樣我們的測試用例不依賴於下游服務的狀態,同時可以自主控制方法的返回值,或者執行特定行為甚至返回異常。首先,powermock就是m...

springboot mockito 單測入門

注 啟動專案需要spring boot test.jar請使用1.4.4.release以上包含此版本的springboot啟動。低版本的沒有上面說的那個jar,專案啟動mock物件為null。依賴如下 org.springframework.bootgroupid spring boot star...

go 初識單測

mock 通過各種框架將依賴實現替換成模擬的實現。和寫乙個介面其實沒什麼區別,只不過依賴了mock的框架。gomonkey5種常見用法 封裝順手的腳手架 go tool cover func coverage.out 檢視測試結果。go test cover 可以檢視覆蓋率。go tool cove...