免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
又是神器!基于單基因批量相關(guān)性分析的GSEA

有這樣的使用場(chǎng)景么?

1.已經(jīng)確定研究的基因,但是想探索他潛在的功能,可以通過(guò)跟這個(gè)基因表達(dá)最相關(guān)的基因來(lái)反推他的功能,這種方法在英語(yǔ)中稱(chēng)為guilt of association,協(xié)同犯罪。
2.我們的注釋方法依賴(lài)于TCGA大樣本,既然他可以注釋基因,那么任何跟腫瘤相關(guān)的基因都可以被注釋?zhuān)ㄩL(zhǎng)鏈非編碼RNA。

這個(gè)方法以前闡述過(guò):
單基因批量相關(guān)性分析的妙用

但是這個(gè)方法有個(gè)小缺陷,并不知道最后富集的通路是正向影響還是反向影響,也就是無(wú)法判斷方向。判斷方向的工具也不是沒(méi)有,GSEA就是一個(gè)。所以,我想能不能把批量相關(guān)性分析和GSEA結(jié)合起來(lái)。

GSEA需要的gene set是現(xiàn)成的沒(méi)有問(wèn)題,但是genelist沒(méi)有,這里我們可以把所有基因跟單個(gè)基因的相關(guān)性系數(shù)當(dāng)做LogFC,有正有負(fù),就解決了geneList的問(wèn)題。這個(gè)想法不是我的,是我的一個(gè)學(xué)員的,不過(guò)他要解決的是microRNA把基因的問(wèn)題。

下面來(lái)實(shí)戰(zhàn)一下:

1.首先加載數(shù)據(jù)

這個(gè)數(shù)據(jù)是我下載了TPM數(shù)據(jù),然后提取出乳腺癌的數(shù)據(jù)得來(lái)的。

load(file = 'BRCA_mRNA_exprSet.Rdata')
exprSet <- mRNA_exprSet
test <- exprSet[1:10,1:10]

2.寫(xiě)一個(gè)函數(shù)批量計(jì)算相關(guān)性

這個(gè)函數(shù)只要輸入一個(gè)基因,他就會(huì)批量計(jì)算這個(gè)基因跟其他編碼基因的相關(guān)性,返回相關(guān)性系數(shù)和p值。

batch_cor <- function(gene){
  y <- as.numeric(exprSet[gene,])
  rownames <- rownames(exprSet)
  do.call(rbind,future_lapply(rownames, function(x){
    dd  <- cor.test(as.numeric(exprSet[x,]),y,type='spearman')
    data.frame(gene=gene,mRNAs=x,cor=dd$estimate,p.value=dd$p.value )
  }))
}

3.并行化運(yùn)行函數(shù)

PCDC1這個(gè)基因?yàn)槔?/p>

library(future.apply)
plan(multiprocess)
system.time(dd <- batch_cor('PDCD1'))

這是返回的結(jié)果

4.制作genelist

gene <- dd$mRNAs
## 轉(zhuǎn)換
library(clusterProfiler)
gene = bitr(gene, fromType='SYMBOL', toType='ENTREZID', OrgDb='org.Hs.eg.db')
## 去重
gene <- dplyr::distinct(gene,SYMBOL,.keep_all=TRUE)

gene_df <- data.frame(logFC=dd$cor,
                      SYMBOL = dd$mRNAs)
gene_df <- merge(gene_df,gene,by='SYMBOL')

## geneList 三部曲
## 1.獲取基因logFC
geneList <- gene_df$logFC
## 2.命名
names(geneList) = gene_df$ENTREZID
## 3.排序很重要
geneList = sort(geneList, decreasing = TRUE)

5.運(yùn)行GSEA分析

library(clusterProfiler)
## 讀入hallmarks gene set,從哪來(lái)?
hallmarks <- read.gmt('h.all.v6.2.entrez.gmt')
# 需要網(wǎng)絡(luò)
y <- GSEA(geneList,TERM2GENE =hallmarks)

作圖看整體分布

### 看整體分布
library(ggplot2)
dotplot(y,showCategory=12,split='.sign')+facet_grid(~.sign)

本次結(jié)果中全是激活的

6.特定通路作圖

yd <- data.frame(y)
library(enrichplot)
gseaplot2(y,'HALLMARK_INTERFERON_ALPHA_RESPONSE',color = 'red',pvalue_table = T)

PCDC1跟阿拉法干擾素正相關(guān),這個(gè)事情沒(méi)什么好說(shuō)的吧。

好了,我們又掌握了一個(gè)特別強(qiáng)悍,實(shí)用的技能。我是果子,明天見(jiàn)。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
GEO數(shù)據(jù)挖掘流程——代碼版(方便抄襲)
gsea或者gsva所需要的gmt文件
手把手教你用R做GSEA分析
史上最全GSEA可視化教程,今天讓你徹底搞懂GSEA!
clusterProfiler|GSEA富集分析及可視化
轉(zhuǎn)錄組學(xué)習(xí)八(功能富集分析)
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服