用R語言的DESeq2包來對(duì)RNA

2018.01.08

正好準(zhǔn)備籌集bioconductor中文社區(qū)，我寫簡(jiǎn)單講一下DESeq2這個(gè)包如何用！

library(DESeq2)
library(limma)
library(pasilla)
data(pasillaGenes)
exprSet=counts(pasillaGenes) ##做好表達(dá)矩陣
group_list=pasillaGenes$condition##做好分組因子即可
(colData <- data.frame(row.names=colnames(exprSet), group_list=group_list))
dds <- DESeqDataSetFromMatrix(countData = exprSet,
colData = colData,
design = ~ group_list)
##上面是第一步第一步，構(gòu)建dds這個(gè)對(duì)象，需要一個(gè)表達(dá)矩陣和分組矩陣！?。?/span>
dds2 <- DESeq(dds) ##第二步，直接用DESeq函數(shù)即可
resultsNames(dds2)
res <- results(dds2, contrast=c("group_list","treated","untreated"))
## 提取你想要的差異分析結(jié)果，我們這里是treated組對(duì)untreated組進(jìn)行比較
resOrdered <- res[order(res$padj),]
resOrdered=as.data.frame(resOrdered)
可以看到程序非常好用！
它只對(duì)RNA-seq的基因的reads的counts數(shù)進(jìn)行分析，請(qǐng)不要用RPKM等經(jīng)過了normlization的表達(dá)矩陣來分析。
值得一提的是DESeq2軟件獨(dú)有的normlization方法！
rld <- rlogTransformation(dds2) ## 得到經(jīng)過DESeq2軟件normlization的表達(dá)矩陣！
exprSet_new=assay(rld)
par(cex = 0.7)
n.sample=ncol(exprSet)
if(n.sample>40) par(cex = 0.5)
cols <- rainbow(n.sample*1.2)
par(mfrow=c(2,2))
boxplot(exprSet, col = cols,main="expression value",las=2)
boxplot(exprSet_new, col = cols,main="expression value",las=2)
hist(exprSet)
hist(exprSet_new)

看這個(gè)圖就知道了，它把本來應(yīng)該是數(shù)據(jù)離散程度非常大的RNA-seq的基因的reads的counts矩陣經(jīng)過normlization后變成了類似于芯片表達(dá)數(shù)據(jù)的表達(dá)矩陣，然后其實(shí)可以直接用T檢驗(yàn)來找差異基因了！

但是，如果你的分組不只是兩個(gè)，就復(fù)雜了，你需要再仔細(xì)研讀說明書，甚至你可能需要咨詢實(shí)驗(yàn)設(shè)計(jì)人員或者統(tǒng)計(jì)人員！

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

打開APP，閱讀全文并永久保存查看更多類似文章

用DESeq2包來對(duì)RNA-seq數(shù)據(jù)進(jìn)行差異分析

使用DEseq2做轉(zhuǎn)錄組測(cè)序差異分析的時(shí)候順便去除批次效應(yīng)

轉(zhuǎn)錄組差異表達(dá)分析和火山圖可視化

轉(zhuǎn)錄組的高級(jí)分析前該如何標(biāo)準(zhǔn)化數(shù)據(jù)？

簡(jiǎn)單使用DESeq2/EdgeR做差異分析 – 生信筆記

用limma包的voom函數(shù)來對(duì)RNA

更多類似文章 >>

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版