go分析和kegg分析 GO富集分析 KEGG

2021-10-12 15:08:38 字數 2477 閱讀 2717

##time:2017-10-8

##author:feng shengyu

#一、安裝必須的r包(推薦使用的r版本3.2.2)

#必須要安裝的包:

#  1、clusterprofilter

#  source(「

#  bioclite(「clusterprofilter」)

#  2、org.mm.eg.db/org.hs.eg.db(對應需要研究的物種-小鼠/人)

#  bioclite(「org.mm.eg.db」)/bioclite(「org.hs.eg.db」)

#  3、dose

#  bioclite(dose)

library(clusterprofiler)

library(dose)

library(org.mm.eg.db)

#二 change the type of gene

#使用的上游資料是rna-seq做完的差異表達的基因列表

#example:

# 15431

# 244091

# 15430

# 319158

# 13871

# 109663

# 735269

# 378431

# 21384

# 105247262

#讀取gene list

gene

genesymbol

genesymbol

#轉化基因型別,一般用cufflinks做的結果是symbol,此時需要轉化為entrzid

geneentrezid

#可以同時轉為多個型別的基因

#geneentrezid

#三、enrichment analysis

#go富集分析

ego_cc

orgdb=org.mm.eg.db,

ont = 「cc」,

padjustmethod = 「bh」,

mingssize = 1,

pvaluecutoff = 0.05,

qvaluecutoff = 0.05,

readable = true

setwd(「f:\\生信工具大全\\r」)

write.table(as.data.frame(ego_cc@result),file=」test_cc.txt」,sep=」\t」)

#kegg富集分析

kk organism =」mouse」,

pvaluecutoff = 0.05,

qvaluecutoff = 0.01,

mingssize = 1,

use_internal_data =false

write.table(as.data.frame(kk@result), file=」test_kk.txt」,sep=」\t」)

#作圖展示結果

barplot(ego_cc, showcategory=15, title=」enrichmentgo_cc」) #條狀圖,按p從小到大排的

dotplot(ego_bp,title=」enrichmentgo_cc_dot」) #點圖,按富集的數從大到小的

#——————–核心**———————–

setwd(「f:\\碩士生\\go和kegg富集分析」)

library(clusterprofiler)

library(dose)

library(org.mm.eg.db)

gene

genesymbol

geneentrezid

ego_cc

orgdb=org.mm.eg.db,

ont = 「cc」,

padjustmethod = 「bh」,

mingssize = 1,

pvaluecutoff = 0.01,

qvaluecutoff = 0.01,

readable = true

write.table(as.data.frame(ego_cc@result),file=」haimati_m_up_enrich_go.txt」,sep=」\t」)

barplot(ego_cc, showcategory=15, title=」go_enrichment」) #條狀圖,按p從小到大排的

ego_bp

organism =」mouse」,  # names)

pvaluecutoff = 0.05,

qvaluecutoff = 0.01,

mingssize = 1,

use_internal_data =false

write.table(as.data.frame(ego_bp@result), file=」haimati_m_up_enrich_kegg.txt」,sep=」\t」)

dotplot(ego_bp,title=」enrichmentgo_cc_dot」) #點圖,按富集的數從大到小的

GO富集分析 訊號通路

基因富集分析是分析基因表達資訊的一種方法,富集是指將基因按照先驗知識,也就是基因組注釋資訊進行分類。訊號通路是指能將細胞外的分子訊號經細胞膜傳入細胞內發揮效應的一系列酶促反應通路。這些細胞外的分子訊號 稱為配體,ligand 包括激素 生長因子 細胞因子 神經遞質以及其它小分子化合物等。富集性分析應...

go kegg GO分析和KEGG分析都是啥?

幾乎現在的套路性文章在做完差異表達分析後,都會去做go和kegg富集分析。那麼go和kegg都是什麼?富集分析又是個什麼東西呢?1 為什麼做富集分析?在我們進行差異表達分析的時候,我們會得到很多的差異表達基因。這些基因如果只是按照基因名放到 的話,我們很難找到乙個規律說這些有基因之間有什麼關係的。例...

go kegg GO分析和KEGG分析都是啥?

幾乎現在的套路性文章在做完差異表達分析後,都會去做go和kegg富集分析。那麼go和kegg都是什麼?富集分析又是個什麼東西呢?1 為什麼做富集分析?在我們進行差異表達分析的時候,我們會得到很多的差異表達基因。這些基因如果只是按照基因名放到 的話,我們很難找到乙個規律說這些有基因之間有什麼關係的。例...