轉錄組問題彙總

2021-10-09 01:09:52 字數 1333 閱讀 1198

轉錄組測序不同重複之間的相關性多少合適?測序的深度如何把握?

p > 0.05 ;相關係數r>0.95

測序深度,是測序量除以基因組的長度,例如測序深度10,就相當於測了10次全基因組,50就是測了50次。

測序reads數和測序鹼基數之間如何換算?
單端測序」 :資料量=reads 長度 * reads個數

(reads長度很容易得知,reads數目可以用¥wc -| file.fastq統計出來的結果除以4,因為1個reads在fastq檔案裡通常

是用4行資訊描述。)

雙端測序」:資料量=單端reads長度單端reads個數2

單位換算:1個鹼基=1bp,1kb=1024bp,1m=1024kb,1g=1024m

測序深度的計算方法:測序深度=資料量大小/參考基因組大小

轉錄組測序的過程,從樣本準備到獲取測序資料?
a.樣品的獲得:培養細胞,或者從組織上進行顯微解剖,必要時可以利用流式細胞儀獲取細胞,注意對照組和重複樣品的製備。

b.氮液研磨:加入裂解液對細胞進行裂解,通過低溫高速離心獲取大量核酸的上清。加入含有oligo dt引物和rna >inhibitors以及轉錄酶系,在合適的溫度下進行逆轉錄,獲得cdna文庫,進行第二鏈的合成。

c.利用covaris或者fragment酶進行打斷,末端修復,a-tailing ,adaptors,index引物進行文庫擴增。磁珠純化進行片段大小的篩選。

d.選擇合適的平台進行測序,主流測序儀有hiseq2500,4000,xten等。

e.下機資料bci格式,進行index分選並轉為fastq格式,進行質檢和後續的分析。

轉錄組分析的流程,列舉出每步可用的工具、每步分析的意義?
測序質量評估:檢視公司報告,可去除接頭序列、低質量鹼基trimmomatic軟體

構建基因組索引:ensembl提供的參考基因組基因注釋檔案star工具

reads比對:看rna**(star)

評估比對質量:i**使用samtools和ucsc系列工具

合併表達檔案

轉錄本拼接:stringtie轉錄本拼接

分析go富集分析和gsea富集分析

轉錄組測序

轉錄組測序 轉錄組測序分析可以分為referring sequencing有參轉錄組分析和de novo無參轉錄組分析。有參無參的意思是,有 無參考基因組。1.獲得測序資料,fastq格式,稱之為raw data。fastq檔案說明 每四行為乙個單元。第一行 序列名稱 第二行 序列的鹼基 第三行 序...

轉錄組測序

資料分析與解讀 1.data cleaning 從原始資料 raw data 到乾淨資料 clean data 的過程,有人翻譯成 資料清洗 實在叫不習慣 illumina測序儀下機的資料通常為bcl格式,是將同乙個測序通道 lane 所有樣品的資料混雜在一起的,所以公司一般不會提供bcl檔案。測序...

轉錄組resequencing流程

重測序流程就是有參考基因組的流程,如果是真核生物一般使用tophat和cufflinks的組合方式,得到比對檔案,可變剪下檔案,組裝轉錄本結果 如果想得到某些條件下的新轉錄本,使用cuffmerge融合links得到的gtf檔案,再用cuffcompare把融合的gtf跟參考gtf比較即可,但是!結...