免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
使用clusterProfiler進行GO富集分析

clusterProfiler是一個功能強大的R包,同時支持GO和KEGG的富集分析,而且可視化功能非常的優(yōu)秀,本章主要介紹利用這個R包來進行Gene Ontology的富集分析。

進行GO分析時,需要考慮的一個基礎(chǔ)因素就是基因的GO注釋信息從何處獲取。Bioconductor上提供了以下19個物種的Org類型的包,包含了這些物種的GO注釋信息

packagesorganism
org.Ag.eg.dbAnopheles
org.At.tair.dbArabidopsis
org.Bt.eg.dbBovine
org.Ce.eg.dbWorm
org.Cf.eg.dbCanine
org.Dm.eg.dbFly
org.Dr.eg.dbZebrafish
org.EcK12.eg.dbE coli strain K12
org.EcSakai.eg.dbE coli strain Sakai
org.Gg.eg.dbChicken
org.Hs.eg.dbHuman
org.Mm.eg.dbMouse
org.Mmu.eg.dbRhesus
org.Pf.plasmo.dbMalaria
org.Pt.eg.dbChimp
org.Rn.eg.dbRat
org.Sc.sgd.dbYeast
org.Ss.eg.dbPig
org.Xl.eg.dbXenopus

clusterProfiler在做GO分析時,會讀取這些包中的GO信息,從這里也可以看出,Bioconductor的生態(tài)體系,不同R包的數(shù)據(jù)傳遞和依賴組成了其生態(tài)環(huán)境。

對于以上19個物種,只需要安裝對應(yīng)的org包,clusterProfile就會自動從中獲取GO注釋信息,我們只需要差異基因的列表就可以了,使用起來非常方便。

在進行富集分析時,支持以下兩種算法

1. Over-Representation Analysis

過表達分析其實就是費舍爾精確檢驗,對于以上19個物種,分析的代碼如下

ego <- enrichGO(  gene          = gene,  keyType = "ENTREZID",  OrgDb         = org.Hs.eg.db,  ont           = "CC",  pAdjustMethod = "BH",  pvalueCutoff  = 0.01,  qvalueCutoff  = 0.05,  readable      = TRUE)

gene就是差異基因?qū)?yīng)的向量,keyType指定基因ID的類型,默認為ENTREZID,  該參數(shù)的取值可以參考keytypes(org.Hs.eg.db)的結(jié)果, 建議采用ENTREZID, OrgDb指定該物種對應(yīng)的org包的名字,ont代表GO的3大類別,BP, CC, MF;  pAdjustMethod指定多重假設(shè)檢驗矯正的方法,cufoff指定對應(yīng)的閾值,readable=TRUE代表將基因ID轉(zhuǎn)換為gene  symbol。

2.  Gene Set Enrichment Analysis

ego <- gseGO(  geneList     = geneList,  OrgDb        = org.Hs.eg.db,  ont          = "CC",  nPerm        = 1000,  minGSSize    = 100,  maxGSSize    = 500,  pvalueCutoff = 0.05,  verbose      = FALSE)

GSEA分析通過置換檢驗來計算p值,nPerm指定置換次數(shù)。

對于這19個物種之外的其他物種,也支持讀取基因的GO注釋文件,然后進行分析,注釋文件的格式如下

GeneIdGODescription
1GO:0005819spindle
2GO:0072686mitotic spindle
3GO:0000776kinetochore

只需要3列信息即可,第一列為geneID, 第二列為基因?qū)?yīng)的GO編號,第三列為GO的描述信息。這3列的順序是無所謂的, 只要包含這3種信息就可以了。
讀取該文件,進行分析的代碼如下

data <- read.table(  "go_annotation.txt",  header = T,  sep = "\t")go2gene <- data[, c(2, 1)]go2name <- data[, c(2, 3)]# 費舍爾精確檢驗x <- enricher(gene,TERM2GENE = go2gene,TERM2NAME = go2name)# GSEA富集分析x <- GSEA(gene,TERM2GENE = go2gene,TERM2NAME = go2name)

對于GO富集分析的結(jié)果,clusterProfiler提供了以下幾種可視化策略

1. barplot

用散點圖展示富集到的GO terms,用法如下

barplot(ego, showCategory = 10)

生成的圖片如下

橫軸為該GO term下的差異基因個數(shù),縱軸為富集到的GO Terms的描述信息, showCategory指定展示的GO Terms的個數(shù),默認展示顯著富集的top10個,即p.adjust最小的10個。注意的顏色對應(yīng)p.adjust值,從小到大,對應(yīng)藍色到紅色。

2. dotplot

用散點圖展示富集到的GO terms,用法如下

dotplot(ego, showCategory = 10)

生成的圖片如下

橫軸為GeneRatio, 代表該GO term下的差異基因個數(shù)占差異基因總數(shù)的比例,縱軸為富集到的GO Terms的描述信息, showCategory指定展示的GO Terms的個數(shù),默認展示顯著富集的top10個,即p.adjust最小的10個。

圖中點的顏色對應(yīng)p.adjust的值,從小到大,對應(yīng)藍色到紅色,大小對應(yīng)該GO terms下的差異基因個數(shù),個數(shù)越多,點越大。

3. GO有向無環(huán)圖

調(diào)用topGO來實現(xiàn)GO有向無環(huán)圖的繪制,代碼如下

plotGOgraph(ego)

生成的圖片如下


矩形代表富集到的top10個GO terms, 顏色從黃色過濾到紅色,對應(yīng)p值從大到小。

4. goplot

plotGOgraph展示的信息一樣,都是GO有向無環(huán)圖,只不過采用了igraph中的布局方式,用法如下

goplot(ego)

生成的圖片如下

5.  emapplot

對于富集到的GO terms之間的基因重疊關(guān)系進行展示,如果兩個GO terms系的差異基因存在重疊,說明這兩個節(jié)點存在overlap關(guān)系,在圖中用線條連接起來,用法如下

emapplot(ego, showCategory = 30)

生成的圖片如下

每個節(jié)點是一個富集到的GO term, 默認畫top30個富集到的GO terms, 節(jié)點大小對應(yīng)該GO terms下富集到的差異基因個數(shù),節(jié)點的顏色對應(yīng)p.adjust的值,從小到大,對應(yīng)藍色到紅色。

6. cnetplot

對于基因和富集的GO terms之間的對應(yīng)關(guān)系進行展示,如果一個基因位于一個GO Terms下,則將該基因與GO連線,用法如下

cnetplot(ego, showCategory = 5)

生成的圖片如下

圖中灰色的點代表基因,黃色的點代表富集到的GO terms, 默認畫top5富集到的GO terms, GO 節(jié)點的大小對應(yīng)富集到的基因個數(shù)。

更多用法和細節(jié)請參考官方文檔。

·end·

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
【R】clusterProfiler的GO/KEGG富集分析用法小結(jié)
從基因名到GO注釋一步到位
RNA-seq入門實戰(zhàn)(六):GO、KEGG富集分析與enrichplot超全可視化攻略
補充更新:GO、KEGG(批量分組)分析及可視化
轉(zhuǎn)錄組差異表達分析小實戰(zhàn)(二)
clusterprofiler
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服