干燥綜合征(SS)是一個主要累及外分泌腺體的慢性炎癥性自身免疫病,以口干和眼睛干燥為主要癥狀,并可伴有多器官系統(tǒng)性表現(xiàn)。目前SS的病因與確切分子機制尚不明確,一些miRNA可以作為SS的診斷標志物,作者希望通過較大樣本的WGCNA分析識別SS相關(guān)的基因網(wǎng)絡(luò)特征,確定具有診斷意義的核心基因。
GSE51092中的mRNA表達譜數(shù)據(jù)集包含190例SS患者和32例健康對照組外周血樣本,使用limma包進行差異表達基因分析,以SAM篩選|log2FC| ≥1和FDR <0.05的DEGs,結(jié)果選出1,483個DEGs,表1展示了差異表達最明顯的20個上調(diào)基因和10個下調(diào)基因。
確定合適的soft-thresholding power(軟閥值)建立臨近矩陣以使基因分布符合無標度網(wǎng)絡(luò)特征,圖A中對1到20的軟閥值進行了網(wǎng)絡(luò)拓撲分析,左圖縱坐標為無標度拓撲擬合指數(shù),以0.9作為閾值,右圖為平均連接度,結(jié)果確定8作為軟閥值。
對基因進行聚類分析,對聚類樹以動態(tài)剪切法最終得到17個共表達模塊(圖B),其中藍綠色模塊中包含的基因最多,其次是黑色、藍色和黃色。
圖C中拓撲重疊熱圖顯示上述模塊之間的高度獨立性。
模塊-特征相關(guān)性熱圖(圖A)和各模塊的基因顯著性值(圖B)顯示多個模塊與SS相關(guān),其中藍綠色模塊與SS相關(guān)性最高。圖C顯示藍綠色模塊中 module membership(MM)與基因顯著性之間的相關(guān)性,以基因顯著性>0.4且MM較高(加權(quán)相關(guān)指數(shù)>0.9)為標準,將前19個基因確定為hub基因,圖D中展示了這19個基因的拓撲重疊熱圖,顯示出基因之間的高正相關(guān)。
作者對藍綠色模塊中的基因進行了GO富集分析,結(jié)果顯示基因主要富集在對病毒的反應(yīng)、免疫反應(yīng)、防御反應(yīng)、對細胞因子刺激的反應(yīng)、炎癥反應(yīng)等生物過程(圖A)。Circos圖對基因與GO terms的關(guān)系進行交叉驗證,顯示其中大量與免疫反應(yīng)相關(guān)的基因也同時富集在其他生物過程中,表明這些基因可能與協(xié)調(diào)SS發(fā)展的多種生物途徑有關(guān)。
作者對WGCNA鑒定的hub基因中沒有SS相關(guān)研究的5個基因進行了表達差異的驗證與功效評估:EIF2AK2 (A),GBP1 (B),PARP12 (C),TDRD7 (D),PARP14 (E)。圖4為原數(shù)據(jù)集,圖5圖6中作者使用GSE84844(30例SS患者與30例對照組外周血單核細胞的表達譜數(shù)據(jù))和GSE66795(131例SS患者與30例健康對照組外周血表達譜數(shù)據(jù))兩數(shù)據(jù)集進行驗證。結(jié)果顯示以上5個基因表達量在SS患者中均顯著上調(diào)(P < 0.001)。
圖7中作者以ROC曲線評估了5個基因的診斷價值,結(jié)果顯示在3個數(shù)據(jù)集中5個基因的AUC值均大于0.7,表現(xiàn)出較高的診斷價值。
作者分別以5個hub基因的表達量中值將樣本分為兩組進行GSEA分析,以MSigDB中的h.all.v6.2.sytmbols.gmt作為參考基因集。圖8展示了5個hub基因分組中差異表達基因的富集結(jié)果氣泡圖,作者從中選出與免疫相關(guān)的基因集進行進一步分析。
結(jié)果顯示EIF2AK2(圖9A)和TDRD7(圖9E)高表達組中“inflammatory response”、 “interferon α response”和 “interferon γ response三個基因集顯著富集。GBP1高表達組中“Regulation of the immune response”、“Regulation of the defense response” 和 “response to cytokine”三個基因集顯著富集(圖9B)。PARP12(圖9C)和PARP14(圖9D)高表達組中“inflammatory response” 和 “interferon α response”兩個基因集顯著富集。
小結(jié)
這篇文章中作者主要是對SS數(shù)據(jù)集進行WGCNA分析構(gòu)建基因網(wǎng)絡(luò),鑒定出與SS相關(guān)的模塊和核心基因后對其進行了功能通路富集和診斷價值評估。作者首先篩選出數(shù)據(jù)集樣本的DEGs,然后使用WGCNA將基因分為不同的模塊,并進行了模塊-特征相關(guān)性分析,在與SS相關(guān)性最高的藍綠色模塊中鑒定出核心基因。進一步對藍綠色模塊中的基因進行GO富集分析,并使用其他兩個數(shù)據(jù)集驗證了核心基因的差異表達和診斷價值,最后對核心基因進行了單基因的GSEA分析。功能富集結(jié)果均顯示在病毒反應(yīng)、防御反應(yīng)、對細胞因子刺激以及干擾素的反應(yīng)等多個免疫相關(guān)通路中顯著富集。