KEGG被称为京都基因组百科全书,是一个综合性的数据库。对于如此庞大的数据库,确定须要对数据进行分门别类的整理。除了将各类数据拆分到不一样的子数据库中以外,KEGG还对全部的数据进行了更加细致的功能分类,这些功能分类的信息就存储在brite 数据库中。html
birte 主要包含如下五大类别的分类信息:java
genes and proteinreact
compounds and reactions数据库
drugs编程
diseasesjson
organisms and cells微信
在brite数据库中,以文件的形式存储分类信息。包含两种格式的文件:网络
table 格式,好比对药物的分类编辑器
http://www.genome.jp/kegg/drug/br08340.html工具
htext 文件,好比kegg orthology 的分类
http://www.kegg.jp/kegg-bin/get_htext?ko00000.keg
提供了两种格式的文件用于下载,htext
对应的后缀为 keg, json
对应json。
json
格式是网络数据传说的新标准,主要用于程序解析;`keg 文件是纯文本文件,能够用文本编辑器打开。
以全部ko的分类文件 ko00000.keg
文件为例:
分类层级按照字母顺序排列,示例文件中A 为第一级分类,B, C, D 依次为第二级。
咱们能够直观的看到 K00844 属于Glycolysis / Gluconeogenesis
这个分类,对应的更上一级的分类为Carbohydrate metabolism
,再上一级为 Metabolism
。
keg 文件格式仍是很是容易理解的,可是使用起来不够直观,当咱们想要查询某个KO的具体分类时,若是和这个KO处于同一分类的节点太多时,须要往上翻阅不少行,才能找到对应的分类;有时一不当心就翻过了,就会搞错。
固然能够经过程序格式化这个文件,好比将这个文件变成以下的格式:
KO | Name | C | B | A |
---|---|---|---|---|
K00844 | HK… | Glycolysis… | Carbo..bolism | Metabolism |
这样方便查看条目的详细分类信息;
对于没有编程基础的人来讲,kegg 提供了keggHier
程序,专门用于查看brite中的分类信息。软件是用java 开发的,提供了图形界面,简单易用;
下载地址 :
http://www.kegg.jp/kegg/download/kegtools.html
使用方法
双加批处理文件启动
从菜单栏点击
File
按钮,选择导入kegg网站上的数据这里选择第一个
kegg pathway map
的分类结构,进行查看
向下的三角形表示展开的意思,这里有3个,说明pathway 共有3层分类,鼠标能够点击任意一条记录,能够展开详细信息;右上角的搜索框能够搜索,经过搜索框能够快速查找你感兴趣的记录
总结:
brite
是存储分类信息的数据库,提供了包含pathway, ko, module, drug, disease,organism 等全部记录的分类;分类信息经过文件进行距离,有
keg
和table
两种格式;经过
KEGGHier
工具,能够方便的浏览 KEGG 分类系统;
本文分享自微信公众号 - 生信修炼手册(shengxinxiulian)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。