本篇接著介紹下列 4種 api 的用法:
get
conv
link
4.ddi
根據(jù)提供的kegg 標(biāo)識(shí)符,返回特定的記錄,多個(gè)標(biāo)識(shí)符之間用+
連接,一次最多允許10個(gè)標(biāo)識(shí)符,格式如下
http://rest.kegg.jp/get/dbentries[/option]
dbentries = KEGG database entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | disease_ja | drug_ja | dgroup_ja | environ_ja | compound_ja
option = aaseq | ntseq | mol | kcf | image | conf | kgml | json
共有兩種用法
第一種用法,不帶任何的option, 返回的結(jié)果和網(wǎng)頁(yè)版的結(jié)果類似
示例:返回hsa:10458
基因的信息
http://rest.kegg.jp/get/hsa:10458
ENTRY 10458 CDS T01001NAME BAIAP2, BAP2, FLAF3, IRSP53DEFINITION (RefSeq) BAI1 associated protein 2ORTHOLOGY K05627 BAI1-associated protein 2ORGANISM hsa Homo sapiens (human)PATHWAY hsa04520 Adherens junction hsa04810 Regulation of actin cytoskeletonBRITE KEGG Orthology (KO) [BR:hsa00001] Cellular Processes Cellular community - eukaryotes 04520 Adherens junction 10458 (BAIAP2) Cell motility 04810 Regulation of actin cytoskeleton 10458 (BAIAP2) Membrane trafficking [BR:hsa04131] Endocytosis Bin/Amphiphysin/Rvs (BAR) family proteins I-BAR proteins 10458 (BAIAP2)POSITION 17q25.3...
第二種用法,后面加上options 操作,需要注意的是,特定的數(shù)據(jù)庫(kù)有特定的option。
對(duì)于gene 數(shù)據(jù)庫(kù)而言,支持 aaseq 和 ntseq
, 返回基因的序列
示例:返回基因的核酸序列
http://rest.kegg.jp/get/hsa:10458/ntseq
>hsa:10458 K05627 BAI1-associated protein 2 | (RefSeq) BAIAP2, BAP2, FLAF3, IRSP53; BAI1 associated protein 2 (N)atgtctctgtctcgctcagaggagatgcaccggctcacggaaaatgtctataagaccatcatggagcagttcaaccctagcctccggaacttcatcgccatggggaagaattacgagaaggcactggcaggtgtgacgtatgcagccaaaggctactttgacgccctggtgaagatgggggagctggccagcgagagccagggctccaaagaactcggagacgttctcttccagatggctgaagtccacaggcagatccagaatcagctggaagaaatgctgaagtcttttcacaacgagctgcttacgcagctggagcagaaggtggagctgga
對(duì)于pathway 數(shù)據(jù)庫(kù)而言,支持 image , conf, kgml ,但是一次只允許查詢1條記錄
示例: 返回hsa05130
的通路圖
http://rest.kegg.jp/get/hsa05130/image
對(duì)于 compound, glycan, drus 數(shù)據(jù)庫(kù),支持 images , mcol, kcf 操作,對(duì)于images , 一次只允許返回一條記錄
示例 : 返回 C00002
的結(jié)構(gòu)示意圖
http://rest.kegg.jp/get/C00002/image
轉(zhuǎn)換kegg 的ID 和其他數(shù)據(jù)庫(kù)的ID
第一種格式,所有記錄之間的轉(zhuǎn)換
http://rest.kegg.jp/conv/target_db/source_db
(target_db source_db) = (kegg_db outside_db) | (outside_db kegg_db)
For gene identifiers:
kegg_d> = org
org = KEGG organism code or T number
outside_d> = ncbi-geneid | ncbi-proteinid | uniprot
For chemical substance identifiers:
kegg_db = compound | glycan | drug
outside_db = pubchem | chebi
示例: human的ncbi entrez ID 和 kegg 的ID 進(jìn)行轉(zhuǎn)換
http://rest.kegg.jp/conv/hsa/ncbi-geneid
ncbi-geneid:1 hsa:1ncbi-geneid:10 hsa:10ncbi-geneid:100 hsa:100ncbi-geneid:1000 hsa:1000ncbi-geneid:100008587 hsa:100008587ncbi-geneid:100008588 hsa:100008588ncbi-geneid:100008589 hsa:100008589ncbi-geneid:100009667 hsa:100009667ncbi-geneid:100009676 hsa:100009676
第二種格式, 某幾條記錄之間的轉(zhuǎn)換,格式和第一種相同,只不過(guò)每次返回幾條記錄之間的對(duì)應(yīng)關(guān)系,多條記錄用+
連接,1次最多允許10條記錄
示例,查詢hsa:10458
和 ece:Z5100
兩個(gè)基因?qū)?yīng)的 ncbi protein id
http://rest.kegg.jp/conv/ncbi-proteinid/hsa:10458+ece:Z5100
hsa:10458 ncbi-proteinid:NP_059345ece:Z5100 ncbi-proteinid:AAG58814
檢索兩個(gè)數(shù)據(jù)庫(kù)之間的關(guān)聯(lián),共有兩種用法
第一種,兩個(gè)數(shù)據(jù)庫(kù)之間的關(guān)聯(lián)
http://rest.kegg.jp/link/target_db/source_db
target_db = database
source_db = database
database = pathway | brite | module | ko | genome | org | vg | ag | compound |
glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | atc | jtc | ndc | yj | pubmed
示例:human 基因和pathway 之間的對(duì)應(yīng)關(guān)系
http://rest.kegg.jp/link/pathway/hsa
hsa:10327 path:hsa00010hsa:124 path:hsa00010hsa:125 path:hsa00010hsa:126 path:hsa00010hsa:127 path:hsa00010hsa:128 path:hsa00010hsa:130 path:hsa00010
第二種,查詢某幾條記錄在兩個(gè)數(shù)據(jù)庫(kù)之間的關(guān)聯(lián)
示例:查詢hsa:10458和ece:Z5100 兩個(gè)基因?qū)?yīng)的pathway 信息
http://rest.kegg.jp/link/pathway/hsa:10458+ece:Z5100
hsa:10458 path:hsa04520hsa:10458 path:hsa04810ece:Z5100 path:ece05130
查找藥物之間的相互作用關(guān)系 , URL 格式如下
http://rest.kegg.jp/ddi/dbentry
dbentry = Single entry of the following database
database = drug | ndc | yj
可以提供1個(gè)藥物的ID, 也可以一次提供多個(gè),多個(gè)ID 用+
連接
示例 : 查詢和D005664
這種藥物存在相互作用的記錄
http://rest.kegg.jp/ddi/D00564
dr:D00564 cpd:C00304 P unclassifieddr:D00564 cpd:C01946 P unclassifieddr:D00564 cpd:C04931 P unclassifieddr:D00564 cpd:C05849 P unclassified
kegg API 允許我們方便的獲取各種資源,最大的好處是我們可以通過(guò)程序批量下載,比如批量下載一個(gè)物種所有的pathway通路圖或者kgml 文件。API的用法也很簡(jiǎn)單,關(guān)鍵是我們要理解返回的數(shù)據(jù)有什么意義,比如 kgml 文件中記錄了哪些信息,conf 文件中的數(shù)字代表了什么,后續(xù)我會(huì)詳細(xì)介紹這些東西,通過(guò)kgml ,conf , 可以實(shí)現(xiàn)很多有意思的功能。
聯(lián)系客服