GO介紹
GO是Gene ontology的縮寫,GO數(shù)據(jù)庫分別從功能、參與的生物途徑及細(xì)胞中的定位對基因產(chǎn)物進(jìn)行標(biāo)準(zhǔn)化描述,即對基因產(chǎn)物進(jìn)行注釋,通過GO富集分析可以了解差異基因富集在哪些生物學(xué)功能、途徑或者細(xì)胞定位,是高通量測序數(shù)據(jù)解讀中比較常用的一種數(shù)據(jù)分析方法。
下面跟著小編一起來來學(xué)習(xí)如何用excel畫GO 功能分類圖吧~
一.圖片結(jié)構(gòu)說明
觀察上圖,發(fā)現(xiàn)橫坐標(biāo)有分子類和父類,其次是縱坐標(biāo)為雙坐標(biāo)軸,左邊軸數(shù)值是功能對應(yīng)的基因數(shù)目,右邊軸數(shù)值是功能對應(yīng)的基因數(shù)目占圖中所有功能對應(yīng)的基因總數(shù)的百分比。
二.圖片繪制過程
繪圖數(shù)據(jù)為關(guān)注的一群基因,比如差異明顯的1000個(gè)gene,或者某個(gè)轉(zhuǎn)錄組de novo測序項(xiàng)目拼接到的40000個(gè)基因。我們想看看這些基因主要集中在哪些功能上。
本文示例數(shù)據(jù)是大概600個(gè)動(dòng)物miRNA的靶標(biāo)基因,這些靶標(biāo)基因大約有20000個(gè),分布較多的60個(gè)GO功能(3個(gè)大類:biological_process,cellular_component和molecular_function,每個(gè)大類的分布基因數(shù)量最多的20個(gè)功能),首先要統(tǒng)計(jì)到這些功能對應(yīng)的基因數(shù)目。
數(shù)據(jù)格式原本是這樣的:
*第1列是GO功能ID號,
*第2列是分屬于3大類功能的分類,
*第3列是子級的功能描述,
*第4列是對應(yīng)功能的基因數(shù)目,
*第5列基因數(shù)目是占3個(gè)top20功能所有基因總數(shù)的比例。
首先,第2列功能只保留第一個(gè)單元格內(nèi)容:
第二步選中第4列數(shù)據(jù):點(diǎn)擊【插入】→【圖表】
得到初始圖片如下所示:
選中柱狀圖,鼠標(biāo)右鍵單擊:【選擇數(shù)據(jù)】→【編輯】
選擇軸標(biāo)簽數(shù)據(jù)列表,點(diǎn)擊【確定】:
導(dǎo)入橫坐標(biāo)信息,點(diǎn)擊【確定】:
得到如下初始圖:
然后,再查看一下表格右下角數(shù)據(jù)的行數(shù):
選中柱狀圖,鼠標(biāo)右鍵單擊:【選擇數(shù)據(jù)】→【編輯】
把圖片拉得足夠長,直到可以看見新添加的百分比數(shù)據(jù):
選中藍(lán)色的基因數(shù)目柱狀圖系列:
點(diǎn)擊【添加圖表元素】→【圖例】:
如上圖,出現(xiàn)系列2之后,點(diǎn)擊【系列2】→【設(shè)置數(shù)據(jù)系列格式】:
調(diào)整好次坐標(biāo)軸以后,將圖寬度調(diào)整到適中,可以看到雙坐標(biāo)已經(jīng)繪制好了:
然后再查看一下兩列數(shù)據(jù)的最大值:
設(shè)置主縱坐標(biāo)最大值為2517,最小值為0:
設(shè)置次縱坐標(biāo)最大值為10.56,最小值為0:
設(shè)置坐標(biāo)軸格式,可調(diào)整坐標(biāo)文字傾斜程度、文字方向:
設(shè)置形狀填充輪廓,調(diào)整表框顏色、粗細(xì):
3大類的框線可以從【插入】→【形狀】→【線條】中添加繪制:
三.主、次坐標(biāo)軸快速生成
下面再來給大家介紹一個(gè)主坐標(biāo)、次坐標(biāo)雙坐標(biāo)軸生成的快速方法:
點(diǎn)擊【插入】→【組合】圖表
然后再像前面講解的錄入方式導(dǎo)入橫坐標(biāo)信息,設(shè)置主次坐標(biāo)的最大值最小值就能快速完成主圖的繪制。
今天的分析技能講解就到這里了~
如有疑問,歡迎留言給小編哦~
分析技能文章排行榜
黃媛 編輯