免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
使用clusterProfiler進行KEGG富集分析

KEGG pathway是最常用的功能注釋數(shù)據(jù)庫之一,可以利用KEGG 的API獲取一個物種所有基因?qū)?yīng)的pathway注釋,human對應(yīng)的API 鏈接如下

http://rest.kegg.jp/link/hsa/pathway

通過該鏈接可以獲得以下內(nèi)容

path:hsa00010 hsa:10327path:hsa00010 hsa:124path:hsa00010 hsa:125

第一列為pathway編號,第二列為基因編號。這里只提供了pathway編號,我們還需要pathway對應(yīng)的描述信息,同樣也可以通過以下API鏈接得到

http://rest.kegg.jp/list/

通過該鏈接可以獲得如下內(nèi)容

path:map00010 Glycolysis / Gluconeogenesispath:map00020 Citrate cycle (TCA cycle)path:map00030 Pentose phosphate pathwaypath:map00040 Pentose and glucuronate interconversionspath:map00051 Fructose and mannose metabolism

第一列為pathway編號,第二列為具體的描述信息。需要注意的是,pathway是一個跨物種的概念,原始的pathway編號為map或者ko加數(shù)字,對于特定物種,改成物種對應(yīng)的三字母縮寫, 比如human對應(yīng)hsa, 所有擁有pathway信息的物種和對應(yīng)的三字母縮寫見如下鏈接

https://www.genome.jp/kegg/catalog/org_list.html

clusterProfiler也是通過KEGG API去獲取物種對應(yīng)的pathway注釋,對于已有pathway注釋的物種,我們只需要知道對應(yīng)的三字母縮寫, clusterProfiler就會聯(lián)網(wǎng)自動獲取該物種的pathway注釋信息。

和GO富集分析類似,對于KEGG的富集分析也包含以下兩種

1. Over-Representation Analysis

過表達分析其實就是費舍爾精確檢驗,分析的代碼如下

ego <- enrichKEGG(  gene          = gene,  keyType     = "kegg",  organism   = 'hsa',  pvalueCutoff      = 0.05,  pAdjustMethod     = "BH",  qvalueCutoff  = 0.05)

我們只需要提供差異基因的列表和物種對應(yīng)的三字母縮寫,默認基因ID為kegg gene id, 通過keyType參數(shù)指定,也可以是ncbi-geneid, ncbi-proteind, uniprot。

不同類型ID的轉(zhuǎn)換也是通過KEGG API實現(xiàn)的,比如hsa的kegg gene id和ncbi-geneid的對應(yīng)關(guān)系見以下鏈接

http://rest.kegg.jp/conv/ncbi-geneid/hsa

hsa:1 ncbi-geneid:1hsa:100009667 ncbi-geneid:100009667hsa:100009676 ncbi-geneid:100009676hsa:10 ncbi-geneid:10hsa:100 ncbi-geneid:100

在clusterProfiler中,可以通過bitr_kegg函數(shù),調(diào)用KEGG API, 來實現(xiàn)ID 轉(zhuǎn)換功能,示例如下

bitr_kegg("1",fromType = "kegg",toType = 'ncbi-proteinid',organism='hsa')

2.  Gene Set Enrichment Analysis

對應(yīng)的函數(shù)為gseKEGG, 用法如下

kk <- gseKEGG(  geneList  = gene,  keyType  = 'kegg',  organism = 'hsa',  nPerm  = 1000,  minGSSize = 10,  maxGSSize = 500,  pvalueCutoff = 0.05,  pAdjustMethod     = "BH")

對于pathway數(shù)據(jù)庫中沒有的物種,也支持讀取基因的pathway注釋文件,然后進行分析,注釋文件的格式如下

GeneIdKEGGDescription
1ko:00001spindle
2ko:00002mitotic spindle
3ko:00003kinetochore

只需要3列信息即可,第一列為geneID, 第二列為基因?qū)?yīng)的pathway編號,第三列為pathway的描述信息。這3列的順序是無所謂的, 只要包含這3種信息就可以了。

讀取該文件,進行分析的代碼如下

data <- read.table(  "pathway_annotation.txt",  header = T,  sep = "\t")go2gene <- data[, c(2, 1)]go2name <- data[, c(2, 3)]# 費舍爾精確檢驗x <- enricher(gene,TERM2GENE = go2gene,TERM2NAME = go2name)# GSEA富集分析x <- GSEA(gene,TERM2GENE = go2gene,TERM2NAME = go2name)

對于KEGG富集分析的結(jié)果,clusterProfiler提供了以下幾種可視化策略

1. barplot

用散點圖展示富集到的pathways,用法如下

barplot(kk, showCategory = 10)

生成的圖片如下

橫軸為該pathway的差異基因個數(shù),縱軸為富集到的pathway的描述信息, showCategory指定展示的pathway的個數(shù),默認展示顯著富集的top10個,即p.adjust最小的10個。注意的顏色對應(yīng)p.adjust值,從小到大,對應(yīng)藍色到紅色。

2. dotplot

用散點圖展示富集到的pathways,用法如下

dotplot(kk, showCategory = 10)

生成的圖片如下


橫軸為GeneRatio, 代表該pathway下的差異基因個數(shù)占差異基因總數(shù)的比例,縱軸為富集到的pathway的描述信息, showCategory指定展示的pathway的個數(shù),默認展示顯著富集的top10個,即p.adjust最小的10個。

圖中點的顏色對應(yīng)p.adjust的值,從小到大,對應(yīng)藍色到紅色,大小對應(yīng)該GO terms下的差異基因個數(shù),個數(shù)越多,點越大。

3.  emapplot

對于富集到的pathways之間的基因重疊關(guān)系進行展示,如果兩個pathway的差異基因存在重疊,說明這兩個節(jié)點存在overlap關(guān)系,在圖中用線條連接起來,用法如下

emapplot(kk,  showCategory = 30)

生成的圖片如下

每個節(jié)點是一個富集到的pathway, 默認畫top30個富集到的pathways, 節(jié)點大小對應(yīng)該pathway下富集到的差異基因個數(shù),節(jié)點的顏色對應(yīng)p.adjust的值,從小到大,對應(yīng)藍色到紅色。

4. cnetplot

對于基因和富集的pathways之間的對應(yīng)關(guān)系進行展示,如果一個基因位于一個pathway下,則將該基因與pathway連線,用法如下

cnetplot(kk, showCategory = 5)

生成的圖片如下

圖中灰色的點代表基因,黃色的點代表富集到的pathways, 默認畫top5富集到的pathwayss, pathways節(jié)點的大小對應(yīng)富集到的基因個數(shù)。

5. browseKEGG

在pathway通路圖上標記富集到的基因,代碼如下

browseKEGG(kk, "hsa04934")


會給出一個url鏈接,示例如下

https://www.kegg.jp/kegg-bin/show_pathway?hsa04934/111/23236/4221/9586/5087/1026/1871/1583/51176
在瀏覽器中打開會看到如下所示的圖片

富集到的差異基因會用紅色方框表示,更多用法和細節(jié)請參考官方文檔。

·end·

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
聽說你的KEGG分析有大量的基因沒注釋
[重磅]KEGG API, 你會用嗎
利用KEGG數(shù)據(jù)庫進行ID轉(zhuǎn)換
KEGG數(shù)據(jù)庫倒閉了嗎
ID轉(zhuǎn)換不用怕(二),R大神Y叔clusterProfiler包幫你忙
利用KEGG的API獲取基因?qū)?yīng)的pathway 信息
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服