轉錄組分析處理流程

1.fastqc

2.star

##build_index star --runthreadn 9 --runmode genomegenerate \ --genomedir /data/***xx/bio/task_le-mir/03-2mirseq/index \ --genomefastafiles /data/***xxbio/task_le-mir/03-2mirseq/chrom.37.fa \ --sjdbgtffile /data/***xx/bio/task_le-mir/03-2mirseq/mirna37note.gtf \ --sjdboverhang 149 ###star_align ls -d le*|while read le; do echo $le; star --runthreadn 5 --genomedir /data/***xx/bio/task_le-mir/03humansequence/index \ --readfilescommand zcat \ --readfilesin /data/***xx/bio/task_le-mir/01trim_out/$/*_1.fq.gz \ /data/***xx/bio/task_le-mir/01trim_out/$/*_2.fq.gz \ --outfilenameprefix /data/***xx/bio/task_le-mir/04align_out/$_ \ --outsamtype bam sortedbycoordinate \ --outbamsortingthreadn 5 \

--quantmode transcriptomesam genecounts>>$.log; done

3.rsem

###rsem-prepare rsem-prepare-reference --gtf /data/***xx/bio/task_le-mir/03-2mirseq/mirna37note.gtf \ /data/***xx/bio/task_le-mir/03-2mirseq/chrom.37.fa \ /data/***xx/bio/task_le-mir/05-2rsem/rsem_prepare ##rsem calculate expression ls -d le*|while read le; do echo $le; rsem-calculate-expression --paired-end --no-bam-output \ --alignments -p 10 \ -q $/*_aligned.totranscriptome.out.bam \ /data/***xx/bio/task_le-mir/05-2rsem/rsem_prepare \

/data/***xx/bio/task_le-mir/05-2rsem/rsem_out/$_ >>$.log; done

4.deseq2

####將表達定量結果轉換為矩陣
rsem-generate-data-matrix le*_.isoforms.results >output.matrix
###deseq2.r
setwd("/data/***xx/bio/task_le-mir/06deseq2")
##讀取檔案
input_data <- read.table("deseq2_input-2.txt", header=true, row.names=1)
##取整
input_data <-round(input_data, digits = 0)
##1-i型 2-ii型 3-正常+良性 4-補充良性
1, 1, 1, 1, 1, 2, 3, 1, 1, 1, 1, 1, 1, 1, 2, 3, 3, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 1, 1, 1, 1, 1, 2, 
3, 1, 1, 1, 1, 1, 1, 1, 3, 3, 3, 1, 1, 1, 1, 3, 3, 3, 3, 3, 3, 1, 1, 1, 1, 1, 2, 3, 2, 2, 1, 1, 3, 3, 
1, 4, 4, 4, 4, 4, 4, 4
##準備工作
input_data <- as.matrix(input_data)
condition <- factor(c(1, 1, 1, 1, 1, 2, 3, 1, 1, 1, 1, 1, 1, 1, 2, 3, 3, 1, 1, 1, 1, 1, 1, 1, 1, 2,
2, 3, 1, 1, 1, 1, 1, 2, 3, 1, 1, 1, 1, 1, 1, 1, 3, 3, 3, 1, 1, 1, 1, 3, 3, 3, 3, 3, 3, 1, 1, 1, 1, 1, 
2, 3, 2, 2, 1, 1, 3, 3, 1, 4, 4, 4, 4, 4, 4, 4))
coldata <- data.frame(row.names=colnames(input_data), condition)
##載入包
library(deseq2)
##構建dds矩陣
dds <- deseqdatasetfrommatrix(countdata=input_data, coldata=coldata, design=~condition)
##差異分析
dds <- deseq(dds)
##提取結果
res <- results(dds)
##看結果
summary(res)
##按p值排序
res <- res[order(res$padj), ]
resdata <-merge(as.data.frame(res), as.data.frame(counts(dds,normalized=true)), by="row.names", sort=false)
names(resdata)[1] <- "isoform"
##輸出結果檔案
write.table(resdata, file="diffexpr-results.txt", sep="\t", quote=f, row.names=f)
##視覺化展示
plotma(res)
##提取差異結果
awk '' diffexpr-i,ii.txt > upgene.txt
awk '' diffexpr-i,ii.txt > downgene.txt

5.differ gene

轉錄組分析處理流程

轉錄組分析轉錄組分析使用STAR進行比對

轉錄組分析高階轉錄組分析和R資料視覺化

轉錄組分析的正確姿勢

轉錄組分析處理流程

轉錄組分析 轉錄組分析 使用STAR進行比對

轉錄組分析 高階轉錄組分析和R資料視覺化

轉錄組分析的正確姿勢

相關推薦

轉錄組分析轉錄組分析使用STAR進行比對

轉錄組分析高階轉錄組分析和R資料視覺化