?
很多網(wǎng)友跟我們說,天天被KEGG虐,不知道一些符號代表的含義,還不知道怎么找pathway。我們也是操碎了心。其實KEGG除了主體功能pathway之外,還有一些非常好用的在線工具。
今天我們先來科普KEGG數(shù)據(jù)庫的基本知識,后續(xù)我們會陸續(xù)分享上面的在線工具使用哈。
KEGG數(shù)據(jù)庫的內(nèi)容很多,核心是KEGG pathway。數(shù)據(jù)均來自文獻,通過手繪路徑圖集。
如上圖,KEGG除了核心內(nèi)容pathway,還有對數(shù)據(jù)庫的信息分類(如,Brite),或pathway的組成元件的信息(Module、orthology)。
這些信息往往會交叉出現(xiàn)。
我們以“生物素合成酶”為例:
看上面這個圖,注意到這些藍色小字,為什么有些是K開頭的,有些是KO開頭的,還有些是M或者C開頭的,很神煩dei不dei?我們來解釋一下:
1、K num(基因ID號,表示在所有同源物種中具有相似結構或功能的一
類同源蛋白)。
如K01012=>生物素合成酶(備注:K建議大寫)
2、ko num(代謝通路名稱,表示一個特定的生物路徑)
如:ko0078 => 生物素代謝通路 (備注:ko小寫)
3、M num(模塊名稱)
M00123 => 生物素合成模塊
4、C num(化合物名)
如C00120:生物
5、E -.-.-.-(酶名)
EC2.1.1.116 => 生物素合成酶(其實也就是k01012)
6、R num(反應名)
7、RC num(反應類型)RP num(反應物質(zhì)對)
m開頭。這些模塊往往是pathway的重要組成部分(但也只是一部分)。包括:路徑模塊、結構復合物、功能集、信號模塊等。
這里的模塊展示的就是生物合成的過程(上),相當于這個pathway的局部地圖(簡化版)。
KEGG中,信息的層級分類系統(tǒng),KEGG會從不同的角度分層級。如下圖,從pathway,modues和Enzynes三個角度,分析了這個基因的從屬關系。
從酶的角度考慮,這個酶屬于轉(zhuǎn)移酶的大類,更次級的分類是巰基轉(zhuǎn)移酶….這樣層層分類,來展現(xiàn)這個酶的信息。
另外,界面還包括了這個基因在不同物種中的信息,前三個字母是這個物種拉丁名的簡寫,例如ATH代表擬南芥。