具备相同功能的基因被归类到kegg orthology 中,每一个KO 表明具体的一个功能。在生命活动中,每每须要多个功能单位共同发挥做用,好比多个蛋白质构成复合体来发挥调控做用,此时多个KO就整合在了一块儿。这个例子说明在KO 之上,必然还存在一个分类系统,将参与同一过程的多个KO划分在一块儿。实际上,KEGG Module 数据库就是存储这种信息的数据库。数据库
KEGG Module 数据库中的每条记录表明一个功能单元,是多个KO的集合,叫作kegg module, 经过大写字母M和数字进行标识;微信
module 数据库包含如下4大类别的功能:spa
pathway modules.net
structural complexescode
functional setsblog
signature modules图片
更加详细的分类信息能够在brite 数据库中找到,见如下连接get
http://www.kegg.jp/kegg-bin/get_htext?ko00002.kegit
和pathway 相似,对于每条module 的记录,都有一张对应的图片,叫作module map
。io
M0002对应的map 以下图
结合其详细信息,咱们来理解下module 的构成
从Definition 字段的信息,咱们能够看到每一个Module 有多个KO 构成,那么这些KO 之间有什么样的关系呢,这就要从definition 字段的定义提及!
被空白分隔的每一个字段叫作1个block, M0002 能够分红如下5个主要的block
K01803
((K00134,K00150) K00927,K11389)
(K01834,K15633,K15634,K15635)
K01689
(K00873,K12406)
在这里,空格表明的是逻辑与 AND
的关系,表示这5个block 一块儿发挥做用;
在(K01834,K15633,K15634,K15635)
block 中,逗号表明逻辑或OR
的关系,任何一个KO均可以起到这个blcok的做用。
注意在 ((K00134,K00150) K00927,K11389)
中同时出现了逗号和空格,为了正确区分,还使用了圆括号。圆括号内为1个block, 因此K00134,K00150
为1个block, 这个block 和 K00927 用空白分隔,因此是AND关系,而逗号链接的是(K00134,K00150) K00927
和 K11389
两个block。 因此这个block对应的map 就是上图展现的那样。理解了definition 字段的信息,不难发现根据该字段的信息,能够计算出这个module 对应的map。
除了空格和逗号以外,definition 还会出现 +, - 。好比((K01878+K01879),K14164,K01880)
, 加号表明两个KO一块儿做为一个block发挥做用,对应的map 图为
减号表明可选项的意思,表示这个block无关紧要。好比K01866 K01873 -K07587 -K11627 -K01884
。减号链接的block 虽然无关紧要,可是在map图中仍是会出现的。
因为module 由KO 发展而来,因此module 也是跨物种的概念。对于每一个物种而言,也有该物种对应的module, 好比M0000 在human中对应的记录为hsa_M00002;
在物种的module 中,根据包含的block的个数,能够划分红两类
complete module, 包含reference module 中全部的block;
incomplete module , 只缺乏了1个或者2个block;
在物种对应的module map 中,会对该物种对应的KO高亮显示
总结
KEGG Module 数据库是对KO的整合,每一个module 表明1个功能单元,是多个KO的集合;
Module 由block 构成,definition 字段的信息须要理解空格,逗号,加号,减号的不一样含义,根据definition 字段的信息能够计算获得module map;
3.module 是跨物种的概念,最原始的叫作reference module, 定义了block的数量; 物种对应的module 根据包含的block的完整性,能够分为complete module 和 incomplete module; 在物种对应的module map 中,对应的KO会高亮显示
本文分享自微信公众号 - 生信修炼手册(shengxinxiulian)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。