免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
GWAS分析中的GO和KEGG富集分析教程

大家好,我是鄧飛,上一次,我們介紹如何根據(jù)顯著性snp,使用bedtools根據(jù)上下游距離,根據(jù)gff文件注釋基因。(使用bedtools進行gwas基因注釋)

這一次,介紹一下如何根據(jù)注釋的基因,進行富集分析,主要是看一下GWAS定位的基因有沒有某一個趨勢,也算是一種驗證的方法。比如籽粒大小找到的30個候選基因,如果都與籽粒發(fā)育相關的生化途徑一致,那就說明找到的都是相關的基因。

之前用于注釋基因需要的gff文件:

上面紅框中就是基因的名字,這里,我們已經(jīng)注釋到的基因,形成一個txt文件,內(nèi)容如下:

1. R包依賴

下面先載入需要的R包,如果沒有安裝,需要安裝一下:

  library(clusterProfiler)
  library(enrichplot)
  library(topGO)
  library(Rgraphviz)
  library(openxlsx)
  library(ggplot2)

2. 下載數(shù)據(jù)庫

到Bioconductor中(https://www.bioconductor.org/),檢索該物種的數(shù)據(jù)庫:

常見的物種數(shù)據(jù)庫如下:直接在Bioconductor中安裝OrgDB的名稱就行了。

這里,我們用的是水稻的數(shù)據(jù)庫,名稱為:org.Osativa.eg.db

3. 載入數(shù)據(jù)庫和讀取基因名文件

「載入數(shù)據(jù)庫」

library(org.Osativa.eg.db)
db <- org.Osativa.eg.db 
organism <- "dosa" # 物種的名稱

「讀取基因型文件」

geneid = read.csv("gene_total.txt",header = F)
head(geneid)

4. 將ID匹配GID

將geneID,替換為數(shù)據(jù)庫中的GID

map_id = AnnotationDbi::select(db, keys = geneid, columns=c("GID"), keytype = "RAP")
head(map_id)

5. 對基因列表進行GO注釋

GO注釋包括:

  • MF注釋
  • CC注釋
  • BP注釋

「MF注釋:」

go_MF =enrichGO(map_id$GID
                 OrgDb=db,
                 keyType = "GID",
                 ont="MF"
                 pvalueCutoff=1,
                 qvalueCutoff=1, 
                 pAdjustMethod="none")
write.xlsx(go_MF,"go_MF.xlsx")
dotplot(go_MF,color="pvalue")
ggsave("go_MF_dotplot.pdf",width=12,height=6)

結果文件:

同樣的,CC和BP的GO注釋,將ont后面的改為CC和BP即可。

「CC的GO注釋:」

## CC
go_CC =enrichGO(map_id$GID
                OrgDb=db,
                keyType = "GID",
                ont="CC"
                pvalueCutoff=1,
                qvalueCutoff=1, 
                pAdjustMethod="none")
write.xlsx(go_CC,"go_CC.xlsx")
dotplot(go_CC,color="pvalue")
ggsave("go_CC_dotplot.pdf",width=12,height=6)

「BP的GO注釋:」

## BP
go_BP =enrichGO(map_id$GID
                 OrgDb=db,
                 keyType = "GID",
                 ont="BP"
                 pvalueCutoff=1,
                 qvalueCutoff=1, 
                 pAdjustMethod="none")
write.xlsx(go_BP,"go_BP.xlsx")
dotplot(go_BP,color="pvalue")
ggsave("go_BP_dotplot.pdf",width=12,height=6)

其它類型的圖:

## 其它類型的圖:
barplot(go_BP)
heatplot(go_BP)

6. KEGG富集分析

把基因型的ID后面加上“-01”,并且把g變?yōu)閠

rap_id <- paste0(geneid, "-01")
rap_id <- gsub("g","t",rap_id)
head(rap_id)

富集分析:

geneid = read.csv("a1.txt",header = F)$V1
rap_id <- paste0(geneid, "-01")
rap_id <- gsub("g","t",rap_id)
head(rap_id)
kegg <- enrichKEGG(
  gene = rap_id,  #基因列表文件中的基因名稱
  keyType = 'kegg',  
  organism = 'dosa'
  pAdjustMethod = 'fdr',  #指定 p 值校正方法
  pvalueCutoff = 1,  
  qvalueCutoff = 1)  

運行日志:

作圖:

barplot(kegg)
dotplot(kegg)
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
基因(蛋白)功能注釋分析和功能富集分析(GO、KEGG)
GO、KEGG富集分析(一)有參情況
生信實操丨一個生信菜鳥的上道經(jīng)驗分享-轉(zhuǎn)錄組測序(富集分析繪圖篇)
GO 和 KEGG 的區(qū)別 | GO KEGG數(shù)據(jù)庫用法 | 基因集功能注釋 | 代謝通路富集
使用clusterProfiler進行GO、KEGG富集分析(有參情況)
GO,KEGG,DO富集分析
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服