KEGG step by step

核心概念

  • KEGGKyoto Encyclopedia of Genes and Genomes,生物高水平功能是数据库。若是不是使用服务器来查询数据库,须要付费。
  • KO:KEGG ortholog,已知功能(function)的同源基因数据库。全部数据库里的功能都有这个编号,可是每一个功能又还有别的编号,由于每一个对象都同时扮演多个角色,存在于多个子数据中。
    • Pathway:多个功能,组成一个通路。其中通路汇总图一共有7,叫 Atlas。下图是大名鼎鼎的 metabolic pathways
    • Module:多个通路组成一个模块。
    • Brite:一个功能可能在不一样的模块或者通路中起做用,Brite 数据库存贮这种交叉关系。
  • Chemical information:化学物质信息,功能都依附于物质,因此不一样的物质有本身的编号,以括号里的字母区分分类。分为如下4类。
    • Compound(C):圆圈
    • Glycan(G):多糖,这是
    • Reaction(R):线
    • Enzyme(E):方框,一个序列可能对应一个酶,可是序列并非酶自己。
      硝酸盐转运基因
  • 其余分类
    • Organism:数据库里不一样物种的注释结果。每一个物种用三个字母表示,例如 hashomo sapiens。在 Genome数据库里能按照物种来
    • Subject:根据研究范围不一样进行分类。包括癌症、植物、病原菌、病毒等。
  • Tools:回答序列与基因的对应关系,并把一系列基因放到通路或者模块中。
    • BlastKOALA:比对基因组的蛋白质序列(aa)中是否含有数据库中的序列。
    • GhostKOALA:比对转录组的蛋白质序列(aa)中是否含有数据库中的序列。
    • Mapper:在 pathway,模块,brite里搜索,也能够在特定物种中搜索。
      • Reconstructe:完成在线注释以后会获得结果。里面有重构选项。
      • Search:搜索几个基因,就能完成重构。
      • Color:能按照本身的需求来进行配色。例如强调某个基因。

这些都是在线完成的,因此网速是硬伤。css

基本流程

1               2             3
Contigs ->  Amino acids -> KO numbers -> Maps
  1. 从测的核酸序列到预测的氨基酸序列;
  2. 在数据库中找是否有类似的氨基酸序列;
  3. 把同一批的序列放到代谢通路,模块或者功能关系中。

氨基酸序列

实际上KEGG要的是氨基酸序列,可是咱们不老是能直接拿到氨基酸序列,好比早起的NCBI序列就可能没有注释,或者做者当时没选注释。若是是这种状况,就须要本身注释,使用Prokka,10min就能完成,可是你仍是不会,那不如上传到NCBI,请他们来注释,大概等个7天,也就行了。html

注释

  1. 上传的时候选择参考物种,或者只选大类,真核原核。
  2. 收到邮件,点击submit。若是不想注释了就点 cancel,否则这个邮箱就不能用。
  3. 收到注释完成的邮件,完成。

保存结果

  • 进入连接(只有7天有效),在连接里能下载结果。数据库

    P0001 K0111111 proteinapi

  • 这里能看到构建的通路,模块或者关系,可是光下载这一页是不能保存其中的图的。
  • 能够下载特别感兴趣的部分,若是须要再次重构,就把下载的文本文件上传到Reconstruct Pathway服务器

结果说明

  • Pathway:会有一副完整的代谢通路图,和其余的细节图。
  • Module:这里会显示出一个模块是否完整,是否是全部须要的基因都存在。
  • Brite:能看到基因都被放到哪些关系中了。这里不会出图。
    结果

应用

对细菌功能的了解程度决定了你能提出什么问题,去哪里找答案。
若是你知道20E测试中对应的是哪一个代谢途径,哪一个关键酶,就能看看基因组中是否是有对应的基因。
若是你不知道,那么能够搜对应的底物,也能知道这个过程与什么基因相关。app

辅助鉴定

  • 细菌是否有运动性:进入 Pathway cell motility
  • 硝酸根还原,ABC-transporter:能不能厌氧生长。
  • 脂肪酸的合成模块
  • 碳源利用里相关通路是否是断了,能决定惟一碳源的结果

高级应用

挖掘出细菌的特殊功能,能大幅提升文章的重要性。koa

  • 从芳香族化合物降解
  • 能利用氨基酸做为惟一碳源
  • 有光合自养能力
  • 参与硫代谢
  • 抗生素合成
  • 从信号通路猜想对元素的抗性
  • 代谢通路重构的时候运行同时上传几种物种注释信息,这样个物种会有本身的颜色。

比较两个细菌的芳香族化合物的代谢通路

# organims 1
gene1   K02874
gene4   K00416
# organism 2
gene7   K12864

https://files.cnblogs.com/files/Xeonilian/merge.txt.css
https://www.kegg.jp/kegg-bin/blastkoala_result?id=82ac4904c56bf41cddc9cf94353fa2b731177a18&passwd=L9IqAn&type=blastkoala测试

相关文章
相关标签/搜索