服务热线:025-85381280 / 15150531205
技术支持

技能“慧”|代谢组学常用数据库之KEGG

发布日期:2019-11-26 浏览次数:700

       代谢组是指基因组的所有下游产物也即最终产物的组合,这些产物是一些参与生物新陈代谢、维持生物体正常功能和生长发育的小分子化合物,主要是相对分子量小于1500Da的内源性小分子。如糖、有机酸、脂质、维生素、氨基酸、芳香烃等等化合物。目前,代谢物的定性已经成为代谢组学研究的主要瓶颈,代谢物的鉴定主要依赖于化合物标准谱图库。


       代谢组学研究中常用的相关数据库有很多种,包括NIST、Fiehn、HMDB、KEGG、METLIN、Chemspider、MzCloud、MassBank、Metabolights等等辣么多,总有同学反馈看不懂啊,研究半天仰天一声长叹。

       那今天小编就先来给大家主要介绍下KEGG数据库在代谢组学中如何运用。在公司做过代谢组学的同学肯定对KEGG代谢通路图不陌生,首先跟大家分享一下如何看懂KEGG代谢通路图,KEGG网址https://www.kegg.jp/。


KEGG Pathway分类


       一般,代谢组学KEGG中存在三大类代谢图,每条pathway都有相应的唯一编号,如脂肪酸生物合成map00061,以下均以该条通路进行详细说明:

       A. reference pathway:根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。通路图中的方框都是白色,方便个性化填充颜色,在KEGG中名字以map开头,节点代表某一基因、该基因编码的酶及这个酶参与的反应,比如map00061,https://www.genome.jp/kegg-bin/show_pathway?map00061。


       B. species-specific pathway:物种特有代谢通路图。绿色框为该物种特有的基因或酶,只有这些绿色的框有更详细的信息。KEGG中名字为特定物种种属英文缩写,比如拟南芥的脂肪酸生物合成,ath00061,https://www.kegg.jp/kegg-bin/show_pathway?ath00061。


注:代谢通路图中,方框代表酶,里面的数字代表EC编号;小圆圈代表代谢物。


       对于KEGG库中收录的物种,咱们分析时可以选用该物种进行代谢物通路注释,这样能够剔除一些冗余信息;如若没有,咱们也可以选择该物种分类下的模式物种或近缘物种或总库,同样也可以进行KEGG pathway分析,具体如下:


如何查询某一特定的代谢通路pathway信息?


       通常,咱们的代谢组学分析结果中会收到差异代谢物代谢通路注释及通路富集气泡图,如果想搞清楚某一调具体的代谢通路,咱们该怎么做呢?

       so easy,只需要在搜索框中输入pathway 的名称,点击search即可。


如何查询某一特定代谢物的信息?


       面对代谢组学检测到的那么多代谢物,而且都是英文名称(小编收到很多客户要求翻译成中文,无奈数据库的化合物信息也都是英文,小编也没办法,做不到呀,只能依赖于各大在线翻译),那如何通过KEGG数据库去了解这个化合物的来龙去脉呢?

       这个也非常简单,直接在KEGG COMPOUND中检索就可以,如下图:



       输入Decanoic acid会查询到该化合物的信息,C代表compound,01571是这个化合物在KEGG中的编号,https://www.kegg.jp/dbget-bin/www_bget?C01571,点击超链接会看到该代谢物更多的信息,包括分子式、精确分子量、分子结构、生化反应、参与的代谢通路、涉及到的酶等,如下图:


如何查询某一代谢途径中涉及到的所有代谢物和酶?


       要清楚阐述的代谢物的生物学机理,不把代谢物上游的酶搞清楚是万万不行的哦,那么如何查询某一代谢途径所涉及的所有代谢物和酶呢?这就要用到KEGG中的一个模块叫LinkDB。

       首先,首页找到LinkDB。


       然后选择LinkDB页面,输入想要查询的pathway。


       查询结果如下(部分):


       这么多信息有没有你想要的呢?看来信息筛选也是一大工程啊。。。


       今天,小编就介绍到这里了,当然,除了KEGG之外还有很多的数据库,在熟练掌握了这些数据库的应用之后,妈妈就再也不用担心我的学习了,收藏起来,跟着集思慧远的编者大大学习更多知识与技能呀。