、
火山圖是大家在閱讀文獻時經(jīng)??吹降膱D,主要用于展示基因的差異表達,在前期篩選課題的時候常用,且常與熱圖搭配出現(xiàn)。因為繪制出來的差異表達的基因形如火山,故得名火山圖。
火山圖主要用于展示顯著差異表達的基因。通常對顯著的定義是:p0.05且兩組表型的基因表達差異/Fold Change在兩倍以上,即FC>=2。但在文獻中我們常見的火山圖橫縱坐標分別是log2FC與-log10Pvalue。以2為底數(shù),取基因表達變化的對數(shù)值為橫坐標使得結(jié)果更容易讀懂:比如,某基因在實驗組中的表達是對照組中的4倍,log24=2,若基因在實驗組中的表達是對照組的2倍,log22=1。在火山圖中,橫坐標每增加一個單位,則說明基因在兩組表型中呈兩倍的差異,。在火山圖中取10為底數(shù)p值的負對數(shù)為縱坐標主要兩個考慮:一,可以使得縱坐標的刻度更合理,因為p值間的差異可能非常大,可以取值正無窮小到1之間;二,對數(shù)處理后的原p值越小對應(yīng)的縱坐標值越大,即越顯著。
火山圖的本質(zhì)是散點圖,理論上可以畫散點圖的工具都可以用來畫火山圖。比如在線網(wǎng)站NetworkAnalyst,SangerBox里面的火山圖繪制工具都可以做火山圖。工具雖然方便但是自己可操作的空間少了,本文先向大家介紹人人都可以快速掌握的excel繪制火山圖的方法。
數(shù)據(jù):
65例病人的正常組織與對應(yīng)的直腸癌中的基因表達數(shù)據(jù)(GEO accession: GSE20842)
Excel繪制火山圖主要分為以下幾個步驟:
打開下載的原始數(shù)據(jù)集,選中表格中P.Value,logFC兩列復(fù)制到新的excel1中(原始數(shù)據(jù)中l(wèi)ogFC即默認的底數(shù)為2,即log2FC)
在新的表格中C2單元格中輸入=-LOG10(A2) 后Enter鍵,得到單元格結(jié)果。再點雙擊擊單元格右下角則會以同樣的函數(shù)生成這一列相應(yīng)的值
從數(shù)據(jù)中篩選出p<=0.05且|log2fc|>=2的數(shù)據(jù)到新列(E,F(xiàn),G)中得到如下excel1表格(自此我們得到了繪制火山圖所需要完整的數(shù)據(jù),excel1中A,B,C三列為原始數(shù)據(jù)中p ,log2FC及對應(yīng)的-log10(P.Value)值。E,F(xiàn),G則為篩選后的數(shù)據(jù)值)
依次選中B/C兩列-插入-圖標散點圖,生成火山圖
更改圖表樣式
選中圖片-圖表工具-設(shè)計-圖表樣式(自由搭配滿意的圖片樣式)
在生成火山圖后,我們需要從所有數(shù)據(jù)中篩選出差異表達的基因,即篩選出p<=0.05且|log2fc|>=2的數(shù)據(jù)
單擊選中圖標數(shù)據(jù)任意一個數(shù)據(jù)點-右鍵選擇“選擇數(shù)據(jù)”-“添加”
在添加的數(shù)據(jù)系列中填寫合適的系列名稱與橫縱坐標軸值(此處系列名稱我們填 p<>,即我們之前篩選出來的E,G,F(xiàn)三列數(shù)據(jù);X,Y軸填寫數(shù)據(jù)對應(yīng)的單元格范圍,此處我們都是2:500)。自此,我們就在火山圖中標記出了我們感興趣的差異表達的基因。
我們可以為火山圖加坐標軸標題,圖例,圖表標題,數(shù)據(jù)標簽等元素
單機選中圖表中任意一個數(shù)據(jù)-右鍵選擇“設(shè)置數(shù)據(jù)系列格式”
通過此菜單欄,可以自定義圖表中的任一元素參數(shù)
選中你感興趣的數(shù)據(jù)點-右鍵選擇“添加數(shù)據(jù)標簽”,顯示該數(shù)據(jù)對應(yīng)的值,然后在原始數(shù)據(jù)中匹配相應(yīng)的genesymbol添加就好啦(同時可以在設(shè)置數(shù)據(jù)系列格式中自定義參數(shù))
本文我們向大家演示如何通過excel繪制自己滿意的火山圖。Excel繪制火山圖主要分為數(shù)據(jù)的處理(篩選你感興趣的數(shù)據(jù)到新列),選擇數(shù)據(jù)并作標記,添加圖表元素(坐標軸與標題名,圖例等參數(shù)),修改元素參數(shù),添加數(shù)據(jù)標簽(可以添加對應(yīng)的gene symbol)等內(nèi)容。Excel操作簡單普遍,相信大家都可以繪制自己滿意的火山圖?。ㄈ粝肜L制更美觀的火山圖,請關(guān)注下周推文:用R語言繪制火山圖)