一:下載安裝該R包
clusterProfiler是業(yè)界很出名的YGC寫的R包,非常通俗易懂,也很好用,可以直接根據(jù)cuffdiff等找差異的軟件找出的差異基因entrez ID號(hào)直接做好富集的所有內(nèi)容;
Bioconductor網(wǎng)站上面有關(guān)于它的介紹,按照上面說的方式來安裝即可
http://www.bioconductor.org/packages/release/bioc/html/clusterProfiler.html
source(“http://bioconductor.org/biocLite.R”);biocLite(“clusterProfiler”)
二、輸入數(shù)據(jù)
diff_gene.entrez文件,是通過各種差異基因軟件找出來的差異基因的entrez ID號(hào)列表,每一個(gè)ID號(hào)一行,幾百個(gè)差異基因就幾百行
三、R語(yǔ)言代碼
[R]
setwd(“C:\\Users\\Administrator\\Desktop\\ref”)
a=read.table(“diff_gene.entrez”)
require(DOSE)
require(clusterProfiler)
gene=as.character(a[,1])
ego <- enrichGO(gene=gene,organism=”human”,ont=”CC”,pvalueCutoff=0.01,readable=TRUE)
ekk <- enrichKEGG(gene=gene,organism=”human”,pvalueCutoff=0.01,readable=TRUE)
write.csv(summary(ekk),”KEGG-enrich.csv”,row.names =F)
write.csv(summary(ego),”GO-enrich.csv”,row.names =F)
[/R]
四、輸出文件解讀
看得懂R語(yǔ)言的都知道,這個(gè)代碼輸出了兩個(gè)文件KEGG-enrich.csv和GO-enrich.csv,就是我們的GO和KEGG富集的結(jié)果,其中內(nèi)容如下
上述表格為差異基因的Gene Ontology富集分析結(jié)果表格。
GO ID: Gene Ontology數(shù)據(jù)庫(kù)中唯一的標(biāo)號(hào)信息
Description :Gene Ontology功能的描述信息
GeneRatio:差異基因中與該Term相關(guān)的基因數(shù)與整個(gè)該Term的總基因數(shù)的比值
BgRation:所有( bg)基因中與該Term相關(guān)的基因數(shù)與所有( bg)基因的比值
pvalue: 富集分析統(tǒng)計(jì)學(xué)顯著水平,一般情況下, P-value < 0.05 該功能為富集項(xiàng)
p.adjust 矯正后的P-Value
qvalue:對(duì)p值進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)的q值
Count:差異基因中與該Term相關(guān)的基因數(shù)
上述表格為差異基因的KEGG Pathway富集分析結(jié)果表格。
ID: KEGG 數(shù)據(jù)庫(kù)中通路唯一的編號(hào)信息。
Description :Gene Ontology功能的描述信息
GeneRatio:差異基因中與該ID相關(guān)的基因數(shù)與整個(gè)該Term的總基因數(shù)的比值
BgRation:所有( bg)基因中與該ID相關(guān)的基因數(shù)與所有( bg)基因的比值
pvalue: 富集分析統(tǒng)計(jì)學(xué)顯著水平,一般情況下, P-value < 0.05 該功能為富集項(xiàng)
p.adjust 矯正后的P-Value
qvalue:對(duì)p值進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)的q值
Count:差異基因中與該Term相關(guān)的基因數(shù)
在我的群里面共享了所有的代碼及帖子內(nèi)容,歡迎加群201161227,生信菜鳥團(tuán)!
http://www.bio-info-trainee.com/?p=1
線下交流-生物信息學(xué)
同時(shí)歡迎下載使用我的手機(jī)安卓APP
http://www.cutt.com/app/down/840375
本文固定鏈接: http://www.bio-info-trainee.com/370.html | 生信菜鳥團(tuán)
聯(lián)系客服