聽(tīng)說(shuō)看到這個(gè)標(biāo)題你是一臉懵逼的狀態(tài)!那就讓omicsPie的老司機(jī)們帶你飛吧!點(diǎn)贊關(guān)注打賞組學(xué)派的小伙伴們?cè)缇妥呱先松鷰p峰了,你還在等什么?仔細(xì)閱讀文章哦,文中有彩蛋,看你有沒(méi)有發(fā)現(xiàn)!
在組學(xué)研究課題中,如果提起數(shù)據(jù)庫(kù),你會(huì)想到什么?小編敢肯定,KEGG數(shù)據(jù)庫(kù)(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書(shū))必將位列前幾位。作為系統(tǒng)生物學(xué)的重要工具,KEGG系統(tǒng)地包含了基因組、酶促反應(yīng)以及生物化學(xué)物質(zhì)等等,為基因組、轉(zhuǎn)錄組、蛋白組、代謝組等組學(xué)研究的數(shù)據(jù)挖掘提供了重要的支撐。
雖然KEGG可以在線訪問(wèn),但對(duì)組學(xué)研究的童鞋們來(lái)說(shuō),能夠批量訪問(wèn)和使用才是王道。今天,小編給介紹KEGG中為批量訪問(wèn)而提供的一個(gè)重要工具,KEGG API接口。通過(guò)它,大家就可以方便地將KEGG整合到大家的工作當(dāng)中。KEGG API是一個(gè)連接KEGG各類數(shù)據(jù)庫(kù)的應(yīng)用程序,主要以URL形式進(jìn)行訪問(wèn):http://rest.kegg.jp/<operation>/<argument>[/<argument2[/<argument3> ...]]<operation> = info | list | find | get | conv | link | ddi
1. 總體的調(diào)用形式:
URL 形式:
http://rest.kegg.jp/<operation>/<argument>[/<argument2[/<argument3> ...]]
<operation> = info | list | find | get | conv | link | ddi
總共7種操作可以選擇,包括info, list, find, get, conv, link, ddi。后面會(huì)具體介紹。
Database 名稱
KEGG數(shù)據(jù)庫(kù)包括了三大類的數(shù)據(jù)庫(kù),包括 KEGG database; KEGG MEDICUS extension database; Outside database (主要用于ID的變換)。
Database entry identifier(標(biāo)識(shí)符)
命名規(guī)則:
KEGG自身帶有17個(gè)數(shù)據(jù)庫(kù),除了“genes”, 'enzyme', 'variant'均使用KEGG 標(biāo)識(shí)符<kid>。
<kid>: 數(shù)據(jù)庫(kù)前綴 5位數(shù)字組成,比如K number (kegg orthology), C number (kegg compound), D number (kegg drug)。例:ADP的kid為C00008
genes: <org>:<gene>, <org>為KEGG organism code或T number genome identifier,<gene>是基因編號(hào),通常來(lái)自NCBI GeneID或INSDC Locus_tag。 例如hsa:10458為human的BAP2基因(NCBI-GeneID :1045)
enzyme & variant: <database>:<entry>, <database>為database縮寫(xiě),<entry>是名稱或編號(hào)。
KEGG database
Output: 純文本格式
操作list, find,conv, link:Tab分隔的文本
操作get:數(shù)據(jù)庫(kù)形式(flat file database format)
操作info:文本消息
HTTP狀態(tài):
狀態(tài)代碼 200: 成功
狀態(tài)代碼 400: 請(qǐng)求失敗 (比如語(yǔ)法錯(cuò)誤)
狀態(tài)代碼 404: 未找到
舉個(gè)簡(jiǎn)單的離子:
在瀏覽器中輸入http://rest.kegg.jp/info/kegg,可以得到整個(gè)KEGG數(shù)據(jù)庫(kù)的統(tǒng)計(jì)信息
累了吧,送你一張實(shí)拍美圖,休息一下
KEGG API操作
1. Info: 呈現(xiàn)數(shù)據(jù)庫(kù)的統(tǒng)計(jì)信息
使用方法:
例:http://rest.kegg.jp/info/kegg:所有KEGG數(shù)據(jù)庫(kù)的數(shù)目統(tǒng)計(jì)信息
2. List: 獲取每個(gè)條目的編號(hào)和定義
使用規(guī)范:
例: http://rest.kegg.jp/list/pathway/hsa: 可以得到人類所有的代謝通路
也可以具體到某個(gè)或幾個(gè)基因:http://rest.kegg.jp/list/hsa:10458 ece:Z5100
3. Find: 通過(guò)關(guān)鍵詞檢索數(shù)據(jù)
使用方法:
例:
搜索含有NAD的compound: http://rest.kegg.jp/find/compound/NAD
所有分子式為C7H10O5的compound: http://rest.kegg.jp/find/compound/C7H10O5/formula
平均分子量為300-310的compound: http://rest.kegg.jp/find/compound/300-310/mol_weight
4. Get: 得到數(shù)據(jù)庫(kù)中的具體條目
使用方法:
例: 檢索編號(hào)為C01290的compound: http://rest.kegg.jp/get/cpd:C01290
檢索人類編號(hào)為05130的pathway圖:http://rest.kegg.jp/get/hsa05130/image
5. Conv: 把KEGG的標(biāo)識(shí)符轉(zhuǎn)化為其他標(biāo)識(shí)符
使用方法:
例:
把將KEGGID 轉(zhuǎn)化為NCBI Protein ID: http://rest.kegg.jp/conv/ncbi-proteinid/hsa:10458 ece:Z5100
把編號(hào)為C00003的compound轉(zhuǎn)化為pubchem ID: http://rest.kegg.jp/conv/pubchem/C00002
6. Link: 在不同數(shù)據(jù)庫(kù)之間進(jìn)行檢索,把KEGG的各個(gè)數(shù)據(jù)庫(kù)連接在一起
使用方法:
例:檢索pathway 00010中的compound:http://rest.kegg.jp/link/cpd/map00010
檢索hsa10458基因參與的pathway: http://rest.kegg.jp/link/pathway/hsa:10458
7. DDI: 藥物與藥物之間的作用
使用方法:
例:檢索藥物D00564的已知相互作用:http://rest.kegg.jp/ddi/D00564
檢索藥物D00564、D00100、D00109相互之間的作用: http://rest.kegg.jp/ddi/D00564 D00100 D00109
聯(lián)系客服