服务热线:025-85381280
文献解读

【Nature子刊】2月新文:利用活性代谢组学鉴定生物活性代谢物

发布日期:2019-03-20 浏览次数:370


  前沿

  由于技术的巨大进步,我们已经进入了多组学时代,能够对细胞分子机制(基因组,转录组,蛋白质组和代谢组)进行系统的定量表征。

  

  代谢物是一种较新的进入组学光谱的物质,这些小分子化合物与基因组和蛋白质组相联系,代表了这个被定义为新陈代谢的动态系统中最下游的阶段。以更直观的方式,新陈代谢可以被描述为具有代谢齿轮的机制,其与基因和蛋白质的活性交织在一起。这些齿轮被视为只是作为一个更大的系统的一个组成部分的功能执行。通过这些不同组学水平的生化组织的信息流被描述为分子生物学的中心法则(图1)。在这个框架内,代谢组已被广泛接受为分子水平的表型的动态和敏感测量,将代谢组学置于与病理生理过程相关的生物标志物和机制发现的最前沿。

  

  图1 代谢产物作为基因和蛋白质活性的活性调节剂

  

  然而,对代谢物的感知主要是作为下游产品的基因和蛋白质活性的标志物,使其对其影响深远的监管活动的认识最小化。事实上,代谢组与所有其他组学水平相互作用并积极调节(图1)。通过这种相互作用,代谢物也是生物过程和表型的直接调控者。这一概念,即代谢物是生物过程中的活跃实体,已被研究数十年,其中开创性地发现乳糖依赖性调节来自lac操纵子的细菌中的基因表达;葡萄糖,脂肪酸和其他脂类可作为胰岛素分泌和敏感性的调节剂;以及营养和能量传感器mTOR激酶的关键细胞作用。最近,随着代谢组学技术的出现和发展,对具有生物活性的代谢物的发现迅速增长。因此,代谢物可以在各种情况下显著影响细胞生理学,支持它们作为生物活性剂的重要作用。

  

  01.代谢活性原理

  

  最近的机制研究表明,活性代谢物强烈影响组学景观的所有层面,从基因组,表观基因组和转录组到蛋白质组。在此框架内,代谢组具有两种控制DNA,RNA和蛋白质功能的总体机制:化学修饰和代谢物-大分子相互作用。

  

  1.1大分子的代谢化学修饰  

  代谢物驱动DNA和RNA(例如甲基化)和蛋白质(翻译后修饰)的关键共价化学修饰。已显示这些化学修饰的动态特征显著影响细胞功能。

  

  蛋白质的翻译后修饰涉及至少几十个不同的小分子,它们可以在酶反应中与不同的氨基酸共价结合,例如,赖氨酸乙酰化(源自乙酰辅酶A),半胱氨酸棕榈酰化(源自棕榈酰基-CoA)或酰化(源自其他酰基-CoA物种)。需要注意的是,乙酰化过程也发生在非酶作用下,整体化学计量比低,功能作用不清。负责翻译后修饰的其他代谢物包括琥珀酰-CoA(精氨酸琥珀酰化),以及用于糖基化和乙酰化的活化糖分子(例如UDP-葡萄糖)(图2a)。其他生物活性代谢物已被证明可控制抗炎反应(通过半胱氨酸残基的烷基化)(图2b),蛋白质稳定(通过蛋白酶体组分的polyADP-核糖基化)(图2c)或酶活性(通过赖氨酸戊二酸化)(图2d)。这些过程的生物活性代谢物分别是衣康酸,ATP-核糖和戊二酰-CoA。通过甲基的转移,各种蛋白质也可以在其赖氨酸残基上甲基化来自S-腺苷甲硫氨酸(SAM)(图2e)。值得注意的是,许多这些代谢物诱导的蛋白质修饰的丰度直接取决于细胞的代谢状态,因此它们代表了表型调节的有力手段。

  

  图2 活性代谢物的大分子修饰的实例

  

  2.2代谢物--大分子相互作用

  

  代谢物-大分子非共价相互作用代表细胞活性调节的第二种模式。典型的例子是代谢物与酶的活性位点的竞争性结合(抑制)和通过代谢物在活性中心以外的位点(变构)的结合来改变酶活性。这些概念不仅适用于酶,还适用于各种调节rRNA(代谢物控制的核糖开关),蛋白质如信号传导受体和各种其他类型的分子。

  

  G蛋白偶联受体(GPCR)是代谢物激活的信号分子的最佳研究实例,并且它们是最早被鉴定为药物靶标的蛋白质。在许多其他受体中,小鼠中的G蛋白偶联受体91(GPR91;也称为琥珀酸受体1)被琥珀酸激活以控制血压,并且GPR40(也称为游离脂肪酸受体1)被几种脂肪酸激活,包括棕榈酸羟基硬脂酸(PAHSA),属于最近发现的一类内源性脂质(图3a)。代谢物与这些受体的结合会引起高度特异性的信号反应,从而导致信号网络的特殊细胞激活。该概念还延伸到转录因子和基因表达的调节。例如,源自饮食的植物雌激素导致雌激素受体的非经典活化,并且以这种方式调节细胞代谢并负面影响乳腺癌细胞对治疗的反应(图3b)。在转录和翻译水平,代谢物可以通过核糖开关起作用。控制核糖开关的代谢物包括赖氨酸,谷氨酰胺,钴胺素,硫胺素焦磷酸盐(TPP)和嘌呤(图3c)。在此过程中,代谢产物结合在不同的mRNA区域,改变mRNA的构象,最终调节蛋白质的翻译。活性代谢组还控制其他必需营养素的摄取和可用性。

  

  图3 活性代谢体对大分子进行非共价修饰的机理


  

  02.代谢组驱动的组学改变

  

  上文讨论的例子包括研究代谢物生物活性的相当简化的方法,重点是单一代谢物和反应。然而,现在有证据表明代谢组对其他组学具有大规模的系统性影响。在过去的十年里,表观基因组的调控也是由代谢状态决定的。然而,只有少数研究系统地分析了代谢变化或代谢物补充对其他组学层次的影响。

  

  目前已在细菌中成功地研究了代谢物-蛋白质相互作用,这为代谢组在蛋白质组范围的复合物形成(蛋白质相互作用组)中的作用提供了证据。在这种情况下,ATP显示促进细菌UTP-葡萄糖-1-磷酸尿苷酰转移酶galF的复合物的形成(图3d)。酵母中的蛋白质中心方法(蛋白质阵列)也探讨了蛋白质的代谢物相互作用规模,揭示了很大程度上尚未开发的调节连接,包括改变YPK,哺乳动物AKT类似物,由酵母胆固醇当量,麦角甾醇。

  

  总之,主动代谢体在系统水平上增强和介导了信号转导、蛋白质平衡和基因表达调控等基本的生物学过程。这些代谢物诱导和代谢物赋予的组学调节是众多研究的重点。然而,最近才开发出在全局范围内研究代谢组,特别是活性代谢组的方法以及询问代谢组与其他组之间相互作用的方法。多组学方法目前侧重于代谢组学-蛋白质组串扰,并面临一些挑战(见下文多组学互作)。需要进一步的技术改进来揭示代谢物诱导的大分子活性的复杂性,以最终控制表型。无论如何,目前的文献已经表明,从代谢组学研究中鉴定出来的代谢物可以调节生理学,这一概念彻底改变了传统的组学技术思想:代谢物并不能为其他组学层提供简单的读数,而是可以作为生物系统的主要调控者。

  

  03.代谢物的鉴定、定量和筛选

  

  历史上,代谢物检测,鉴定和定量已经使用生物化学方法完成,例如标记包括放射性标记,分级分离和体外测试。现在,代谢组学提供了一个独特的发现框架,可以并且已经在多个层面上应用(图4)。生物活性代谢物的鉴定过程是生物活性代谢物发现的重要方面之一。基于质谱的代谢组学数据采集和注释主要通过识别具有特定质荷比(m/z)的代谢物特征来定义。现有多种峰检测和校准软件,包括XCMS Online,MZmine 2(参考),OpenMS和MS-DIAL。第二个部分是特征的注释和代谢产物的鉴定。这包括使用代谢物数据库和光谱库66,其中包括人类代谢物数据库HMDB,METLIN,伯明翰代谢物图书馆核磁共振数据库,BiGG,MassBank,LipidMaps,mzCloud,Fiehn实验室GC-MS数据库和Golm代谢组学数据库。

  

  图4 工作流阐明代谢物的生物活性

  

  生物信息学驱动的代谢途径和网络分析可进一步用于降低数据的复杂性。这个特性最近已经被整合到XCMS Online中,也可以通过MetExplore和其他平台获得。这些方法的目的是优先考虑代谢网络的不同模块或代谢网络的局部富集部分中涉及的代谢物的优先级,从而反映真实活动(同时假设错误匹配将在网络上随机分布)。总而言之,这些方法产生了一系列代谢物,这些代谢物可以与某种表型变化相关联,然后可以筛选其生物活性。

  

  04.多组学联合以确定代谢物活性

  

  除了纯代谢组学外,多组学数据的相关性和集成还可以提供额外的信息层,以改进代谢物的选择过程。例如,代谢物候选物可以与转录组学和蛋白质组学数据整合,作为途径分析的后续,通过推断它们在所选择的目标途径中的重叠。由蛋白质组,转录组和代谢组数据组成的各种综合数据集已经在不同的研究领域产生,从癌症代谢和植物生理学到微生物学。多组学整合的目的是通过定量建模确定不同代谢物的活性,从而允许对特定途径进行有针对性的干预。为此,降低大量数据的复杂性非常重要。必须指出,多组学整合领域是一项持续的工作,目前正在采取多种方法。在大多数研究中,多组学整合是基于与独特代谢物标识符相关的基因命名法,并涉及组合先前产生的途径信息,其可在途径数据库中获得,例如KEGG,Reactome,小分子途径数据库(SMPDB)和Biocyc;Recon和ChemRICH等平台;或由代谢物集富集产生(可通过MetaboAnalyst平台获得)。使用该途径信息的优点是能够降低复杂性并过滤噪声。最近引入的代谢组学引导系统生物学方法整合了多组学数据,其中所有其他组学数据层(基因和蛋白质表达)被映射到非目标代谢组学衍生的途径活动信息。存在用于多组学路径集成的若干其他方法,并且基于网络和机制学习方法正在出现。

  

  将代谢组学和其他组学层面联合在一起,可能是一个具有挑战性的追求。必须充分考虑数据采集的稳健性,样本采集引入的假象(批量效应)以及不同组学数据集的不同特征。目前正在开发简化和有效推进这些方法的能力。挑战还包括由于技术限制(例如,由于分析偏差导致的代谢物覆盖范围有限),代谢网络无法充分验证的现实。最后,正如所指出的,整个组学数据通常没有以充分和全面的方式使用。代谢组学方面的一个限制是缺乏适当的档案和数据共享策略;然而,这些问题正在受到越来越多的关注,例如MetaboLights和Metabolomics Workbench等基于云的代谢组学数据库的基础。

  

  虽然这些整合的多组学方法的当前目标是生成准确的生物学模型,可以预测系统在给定条件下的行为,但代谢组学引导的多组学观点是不同的:我们的最终目标是使用多个组学整合以确定活性筛选的最佳候选者。例如,将下游代谢变化映射到代谢途径和生物网络可以提供机制见解,尤其是当与其他组学数据相关联时。在这些平台中,自动化预测途径分析可以直接有效地将代谢物映射到背景知识数据库,这些数据库可以是策划参考途径数据库或基因组规模网络。然而,可用的代谢谱数据库仅覆盖基因组规模代谢的一小部分(高达60%),表明代谢组学指导策略的一般但可解决的限制。因此,对多维和综合组学规模的分析产生了意想不到的机会和现成的解决方案,用于预测调节表型的代谢物,从而有可能推动活性代谢组学的发展。

  

  05.活性代谢组学的应用

  

  生物活性代谢物非常丰富,已知可以改变从相对简单的原核生物到人类细胞的各种有机体的表型。因此,生物活性代谢物的应用非常广泛(图5A)。例如,代谢物可用于支持生物技术生产,例如百日咳杆菌毒素生产或大肠杆菌蛋白生产。哺乳动物微生物组也易受小分子的调节,并且已经显示出被宿主的代谢组调节,或者相反,微生物组衍生的代谢物,例如丁酸盐,可以用于影响宿主的生理学,包括免疫细胞和饱腹感。在新兴的免疫代谢领域,已经证明前列腺素E2调节免疫应答:基于其空间和时间浓度,它已成为脂类转换和炎症消退的关键介质。

  

  值得注意的是,代谢物的作用取决于环境,与其相关的表型可能因其应用到的生物系统而有很大差异。以上下文相关方式改变表型的生物活性代谢物的一个突出例子是α-酮戊二酸(图5B):在细菌中,它调节葡萄糖代谢和摄取;在秀丽隐杆线虫(Caenorhabditis elegans)中,α-酮戊二酸通过负调节线粒体呼吸,ATP产生和实际上自噬来延长寿命;在胚胎干细胞中,α-酮戊二酸通过促进jumonji C(JMJC)-含有组蛋白去甲基化酶和DNA去甲基化酶的TET家族的活性来调节多能性,从而调节组蛋白甲基化和DNA甲基化规模;

  

  图5 表型调节的代谢物活性

  

  总结  

  随着代谢组学的主流化,代谢物可以作为表型调控者的概念-而不仅仅是表型的生物标记物-正受到新的关注。这里引入术语活性代谢组学来描述代谢组学技术如何用于识别生物活性代谢物,并强调代谢组学作为一种技术已经超越纯粹的生物标记驱动方法。这种由代谢组学引导的活性筛选方法面临的挑战是需要增强的稳健性,这可以通过计算结合代谢组学、系统生物学和生物活性数据来实现,使我们能够识别具有最高潜力调节生物过程和细胞生理学的代谢产物。此外,尽管很容易迷失在问题的细节中(例如,代谢物鉴定和代谢物注释),但许多这些问题已经或正在被解决。这些技术成果的最终目标是使用活性代谢组学作为系统生物活性代谢物发现的主要工具,而不是使用主要集中(即化学蛋白质组学)或繁琐(即分馏)方法。一旦完成-通过识别调节感兴趣系统表型的活性分子-活性代谢组学有可能影响多个科学学科。

  

  点击链接:https://www.nature.com/articles/s41580-019-0108-4查看论文全文。