構建乙個近乎完整的植物基因組

2022-06-17 09:24:16 字數 882 閱讀 4354

目錄植物基因組大小跨越幾個數量級,倍性和雜合性變化,以及新舊基因組轉座子變化等帶來組裝挑戰。三代和物理圖譜提供了新機會,單倍型定相、結構變異分析、從頭泛基因組研究成為新興組裝熱點。

植物基因組發展:

在過去20年種,有400多個植物基因組已發表,包括333個被子植物,15個非被子植物、2個輪藻和44個綠藻。

可查閱:

pacbio通過ccs產生hifi 15 kb reads的方法準確率高達99.8%,解決了錯誤率問題,但每條read成本高了近5倍。

基因組測序的發展,在基因組完整度上已經有了很大提公升。

新演算法的設計目的:correct, overlap, and polish long reads with high error-rates。

演算法隨計算設計、速度、記憶體使用、複雜基因組利用而變化。

組裝的草圖有誤差,必須用高覆蓋度的長讀長或短讀長polish,一般大於三次可達到》99.6%的準確性。

pacbio ccs hifi軟體:peregrine

如下圖,兩條染色體組裝時定相,雜合基因組phasing有如下方法:

組裝經典指標是n50,或者最短序列長度大於組裝的50%,方法過於簡單。

利用組裝圖可以視覺化複雜度和鄰接contig的overlap。

當參考基因組被泛基因組取代時,基因**論將是代表複雜基因組更好的方法。

挑戰:

展望:

參考文獻:todd pmichael. building near-complete plant genomes. curr opin plant biol. 2020 apr;54:26-33.

LAI 評估基因組質量乙個標準

基因組組裝完成之後,就需要對最後的質量進行評估。我們希望得到的contig檔案中,每個contig都能足夠的長,能夠有乙個完整的基因結構,歸納一下就是3c原則 但是這三條原則其實是相互矛盾的,連續性越高,就意味著要處理更多的模糊節點,會導致整體錯誤率上公升,為了保證完全的正確,那麼就會導致conti...

LAI 評估基因組質量乙個標準

基因組組裝完成之後,就需要對最後的質量進行評估。我們希望得到的contig檔案中,每個contig都能足夠的長,能夠有乙個完整的基因結構,歸納一下就是3c原則 但是這三條原則其實是相互矛盾的,連續性越高,就意味著要處理更多的模糊節點,會導致整體錯誤率上公升,為了保證完全的正確,那麼就會導致conti...

乙個完整的健身方案

乙個完全的健身方案應當包含吃 飲食 練 訓練 睡 睡眠 三個方面,而練則由心肺,力量,柔韌三個主要部分組成。有鑑於此,本人給出的訓練計畫是 開始時用5 10分鐘有氧熱身,最後用5 10分鐘拉伸放鬆,中間是40 50分鐘的力量訓練。力量訓練主要有 1 背部 引體向上 頸前下拉 2 胸部 平板臥推 坐姿...