服务热线:025-85381280 / 18551854236
技术支持

宏基因组kegg在线注释

发布日期:2020-10-19 浏览次数:135

       

       宏基因组kegg在线注释Kegg官网(网址https://www.kegg.jp/)自带一些分析工具,今天我们介绍一下KEGG注释工具。



       KOALA(KEGG Orthology And Links Annotation)是KEGG的内部注释工具。





BlastKOALA网址: https://www.kegg.jp/blastkoala/
GhostKOALA网址:https://www.kegg.jp/ghostkoala/

KofamKOALA网址:https://www.genome.jp/tools/kofamkoala/ 



       KEGG用于基因组和元基因组序列的功能表征在线比对工具,2016年发表在jmb杂志。



       Reference: Kanehisa, M., Sato, Y., and Morishima, K. (2016) BlastKOALA and GhostKOALA: KEGG tools for functional characterization of genome and metagenome sequences. J. Mol. Biol. 428, 726-731. [pubmed] [pdf]



       BlastKOALA和GhostKOALA是基因组和元基因组序列的自动注释服务器,它们执行KO分配以表征单个基因功能并重建KEGG途径,BRITE层次结构和KEGG模块,以推断生物体或生态系统的高级功能。可以在KEGG网站上免费获得这两种服务器。



       在BlastKOALA中,在对物种,属或科级别的全基因组序列的非冗余数据集进行BLAST搜索后,由内部使用的KOALA算法的修改版本执行KO分配,该数据集是从KEGG GENES数据库中保留的每个分类类别的KO含量。



       在利用更快的GHOSTX进行数据库搜索并适合于元基因组注释的GhostKOALA中,全基因组数据集补充了Cd-hit簇,包括用于病毒基因的簇。可以下载结果文件并进行操作,以进行进一步的KEGG Mapper分析,例如使用多个BlastKOALA结果的比较途径分析。



接下来我们就具体介绍一下如何在线注释。



       1. 首先我们准备好宏基因组氨基酸序列文件,注意:最多可以上传300 MB的文件大小(平均长度为300的一百万个序列或平均长度为100的三百万个序列)。

       格式可为:





       2.打开kegg在线注释网址https://www.kegg.jp/ghostkoala/








3.邮箱确认信息

       上一步填写的邮箱会收到kegg发的确认或者取消的邮件,点击链接





显示下图,则为确认成功。







4. 等待邮件会收到注释结果。




打开此链接即可看到结果。



下图为生成的详细的结果,直接在网页可预览,结果在网站上可保存7天,最好及时下载。





5. 结果解读:



结果包括以下三大部分:

  Annotation data:kegg注释分类结果。

  KEGG Mapper:kegg比对通路,层次结构,模块结果。

  Taxonomy data:物种分类结果。



详细信息可对应以下图。





       结果1:第一列:输入序列的名称;第二列:比对到的KO号;第三列:得分值;第四列:比对到的第二个KO号;第五列:比对结果较好的KO数量。





       结果2:输入的序列注释到的通路、层次结构、模块信息等。





每个通路下比对到的基因的具体结果展示:



此部分分析的其他结果类似,不再赘述。



       结果3:第一列:输入序列基因名;第二列:KO号;第三列:KEGG有机体等级的第二级;第四列:KEGG有机体等级的第三级;第五列:NCBI上属水平名称;第六列:比对到KEGG上的基因id号;第七列:GHOSTX比对得分值。







可查看详细的物种注释以及注释到的基因数量:





详细的物种分类水平展示见下图:





关注物种的通路信息结果展示:






END