2020 8 25丨微生物基因組重測序流程梳理

2021-10-23 19:30:05 字數 2958 閱讀 3890

高階資料分析(含全基因組群體進化分析)

定製化分析

重複序列分析

參考**

全基因組重測序是對已知基因組序列的物種進行不同個體的基因組測序,並在此基礎上對個體或群體進行差異性分析。sbc將不同梯度插入片段(insert-size)的測序文庫結合短序列(short-reads)、雙末端(paired-end)進行測序,幫助客戶在全基因組水平上掃瞄並檢測與重要性狀相關的基因序列差異和結構變異,實現遺傳進化分析及重要性狀候選基因**。細菌重測序能夠分析近源菌種之間的單核苷酸多型性(snp)、插入(insertion)、缺失(deletion)等基因組變異型別。可以為篩查菌株的優良性狀,菌株抗藥性等研究提供指導與依據。

測序深度(sequencing depth)

測序得到的鹼基總量(bp)與基因組大小(genome)的比值,它是評價測序量的指標之一。測序深度與基因組覆蓋度之間是乙個正相關的關係,測序帶來的錯誤率或假陽性結果會隨著測序深度的提公升而下降。重測序的個體,如果採用的是雙末端或mate-pair方案,當測序深度在10~15x以上時,基因組覆蓋度和測序錯誤率控制均得以保證。

測序深度對基因組覆蓋度和測序錯誤率的影響(hom:純合體 het:雜合體)​

全基因組重測序與denovo測序生信分析流程

全基因組重測序與denovo測序生信分析內容

一般使用fastqc、ngsqctoolkit等軟體,對測序原始資料質量進行檢視。主要內容包括。basicstatistics、per base sequence quality、persequence quality scores……kmer content等11項內容。

資料產出、質控及比對

去除接頭汙染和低質量資料

產出資料及質控統計

初級組裝及評價

k-mer分析

gc-depth分析

比較基因組分析

採用progressivemauve軟體比對不同細菌的染色體序列

參考基因組同源性比較、snp/indel、物種進化分析

snpcalling計算

統計snv的等位基因頻率在全基因組上的分布

稀有等位基因數目在不同類別的snv中的比率分布

snv的類別主要考慮:

(1)無義(nonsense)

(2)化學結構中非同義

(3)所有非同義

(4)保守的非同義

(5)非編碼

(6)同義

另外,針對保守性的討論,我們將分析非編碼區域snv的保守型情況及其分布。

分析物件包括全新**的snp,indel,large deletion, 以及外顯子snp在每個等位基因頻率類別下的數目比率(fraction)。

全新**是指**分析結果與dbsnp(當前版本129)以及deletion資料庫dbvar(2023年6月份版本)和已經發表的有關indels研究的基因組資料經過比較後識別確定的全新的snp,indel以及deletion。dbsnp包含snp和indels; dbvar包含有deletion,duplication,以及mobile element insertion。dbrip以及其他基因組學研究(jc ventrer 以及watson 基因組,炎黃計畫亞洲人基因組)結果提供的short indels和large deletion。

計算snp,deletion,以及insertion 大小分布。

計算snp,deletion,以及insertion中屬於全新**結果的數目佔已有各自參考資料庫數目的比例(相對於dbsnp資料庫;dbsnp包含snp和indels;dbvar包含有deletion,duplication,以及mobile element insertion。dbrip以及其他基因組學研究(jc ventrer 以及watson 基因組,炎黃計畫亞洲人基因組)結果提供的short indels和large deletion)其中,可以給出line,alu的特徵位置。

indel檢測及在基因組的分布:

cnv拷貝數變異與sv結構變異檢測及在基因組中的分布:

能夠檢測到的結構變異型別主要有:插入、缺失、複製、倒位、易位等。根據測序個體序列與參考基因組序列比對分析結果,檢測全基因組水平的結構變異並對檢測到的變異進行注釋。

拷貝數變異檢測軟體:

cnvnator:

變異型別注釋(發生區域統計)

常見軟體有snpeff、annovar、等

密碼子和氨基酸變化統計

鹼基替代型別和比例統計

各基因變異分布統計

候選位點檢測、統計、注釋

候選基因go、kegg功能注釋群體遺傳多樣性分析

主要指標有:群體遺傳多樣性指數計算

常見分析軟體:arlequin、vcftools等

群體進化研究

主成分分析(pca)

系統發生分析(phylogenetic)

遺傳結構(structure)

群體遺傳結構分析

qtl定位

全基因組關聯分析(gwas)

常見分析軟體與演算法:

plink、tassel5.0、gapit、genabel(r庫)、emmax、snpassoc(r包)、grammar-gamma、fast-lmm、fast-lmm-select和bolt-lmm。

選擇性清楚分析

突變功能檢測可結合客戶的需求,協商確定資訊分析內容

採用從頭**和基於資料庫比對的兩種方法對兩個基因組序列進行轉座子(tes)分析,利用repeatmodeler軟體對兩種方法的結果進行整合分析並構建轉座子序列資料庫,使用repeatclassifier軟體對轉座子進行分類,計算基因組中轉座子的序列變異速率,揭示基因組擴張的可能機制。

一文讀懂微生物組

微生物組學是指研究動植物體上共生或病理的微生物生態群體。微生物組包括細菌 古菌 原生動物 真菌和病毒。研究表明其在宿主的免疫 代謝和激素等方面非常重要。圖中展示了微生物組在人類生活的方方面面 鏈結見文末 常見的英文詞彙有microbiota,metagenome,microbiome這三個。想要成為...

水稻微生物組時間序列分析

猜你喜歡 寫在後面 文章主頁 zhang,j.zhang,n.liu,y.x.zhang,x.hu,b.qin,y.xu,h.wang,h.guo,x.qian,j.et al.2018 root microbiota shift in rice correlates with resident t...

植物微生物組文章目錄 181123

文章泛讀 組會文獻 工作效率 實驗分析 組內新聞 零假設和概率分布null hypothesis and probability distribution 群體 樣本 估計和統計功效populations,samples,estimates and power 中心極限定理和t分布central l...