服务热线:18061729102/ 025-85380280
技术支持

叶绿体基因组做完后趁热打铁再发一篇线粒体基因组的文章

发布日期:2021-09-06 浏览次数:623

随着叶绿体基因组渐渐铺开,

趁热打铁咱们把线粒体基因组也一起跟上!

今天给您介绍的就是用植物线粒体基因组数据发BMC Genomics(中科院二区,IF=3.594)的一般性研究思路。目前线粒体基因组这块还比较新,发文章还是比较容易的,我们参考今年3月份最新的一篇《碱蓬线粒体基因组组装和比较分析》来看:

文章技术路线概览:

取暗光生长40天叶片 -> 进行2+3代测序 -> 组装注释线粒体基因组 -> 分析基因组组成 -> 重复序列分析 -> RNA编辑分析 -> 叶绿体和线粒体间水平转移分析 -> KaKs分析 -> 构建系统发育树 -> 比较基因组大小、GC、含量、基因加倍与丢失 -> 阐述研究意义价值。



叶绿体基因组





研究背景

碱蓬,作为藜科一年生草本植物,是一种广泛分布在盐碱地上的植物,具有强烈的盐碱耐受性,也被认为是具有高发展前景和科学研究价值的景观植物。植物线粒体参与与能量产生相关的许多代谢过程和几种化合物的合成和降解,在植物生长发育中发挥着至关重要的作用。对于大多数被子植物来说,核遗传信息是从双亲处继承的,而叶绿体和线粒体遗传则来自母本。这种母系遗传机制消除了父系的影响,从而减少了遗传研究的难度,能促进遗传机制的研究。截至2021年1月,只有351个完整的线粒体基因组存放在Genbank数据库中。最近刚报道了碱蓬叶绿体基因组;然而,线粒体基因组仍未开发。我们采用2+3测序技术组装了碱蓬的线粒体基因组。

线粒体基因组长期以来一直被认为倾向于通过水平转移将DNA与各种细胞内DNA来源整合。因此,植物中的线粒体基因组具有长度、基因序列和基因含量上的显著差异。最小已知的陆生植物的线粒体基因组长度约为66kB,最大的陆地植物线粒体基因组长度为11.3MB 。另外,陆地植物中基因的数量也广泛变化,通常在32和67之间。在这项研究中,我们测序并注释了碱蓬的线粒体基因组,并将其与其他植物基因组(包含裸子植物)进行比较,提供了更好地了解碱蓬的遗传信息的方法。

分析结果

01基因组组装和注释

碱蓬线粒体基因组是环形,长度为474,330bp。基因组的基础组成是A(28.00%),T(27.93%),C(21.62%),G(22.45%)。在线粒体基因组中有61个基因,包括27个蛋白质编码基因,29个tRNA基因和5个rRNA基因。所有蛋白质编码基因使用ATG作为起始密码子,所有三个终止密码子TAA,TGA和TAG具有以下使用率:TAA 44.4%,TGA 37.04%和TAG 18.52%。


叶绿体基因组

叶绿体基因组


02重复序列分析

微卫星或简单的序列重复(SSR),其序列重复单元长度为1-6个碱基对。微卫星具有多态性,显性遗传,相对丰度,广泛的基因组覆盖以及PCR检测中的简单性等特征价值。用串联重复分析软件鉴定了S.Glauca(碱蓬)的线粒体基因组中的SSRs。结果,在S.Glauca的线粒体基因组中发现了361个SSR,单碱基和二碱基的SSR占SSR总数的78.67%。串联重复序列,也称为卫星DNA,有约1至200个碱基的核心重复单元,串联重复几次。发现等于或长于20bp的有928个,其中483是同向的,445个反向的。最长的同向重复为30,706 bp,最长的反向的是12,556 bp。


叶绿体基因组

叶绿体基因组


03RNA编辑的预测

RNA编辑是指在真核生物中发现的转录RNA的编码区域中添加,删除或改变碱基的情况。在没有蛋白质组学数据的支持下,不可能检测到准确的RNA编辑。但是,PREP软件可用于预测RNA编辑,在这些蛋白质编码基因中,COX1没有预测的任何编辑位点,而ccmB具有预测的最多编辑位点(29)。这些编辑位点,35.19%(76)是在密码子的第一位上;63.89%(138)发生在第二位上,同时还发现存在密码子的两位同时发生变化:CCC->TTC;RNA编辑后,42.13%的氨基酸的疏水性没有变化。然而,预测45.83%的氨基酸以从亲水转变为疏水,而11.11%预测从疏水变化到亲水性。RNA编辑可能导致蛋白质编码基因的过早终止,并且在S.Glauca线粒体基因组中,ATP4和ATP9可能发生这种现象。结果还表明,预测编辑密码子的氨基酸显示RNA编辑后的有亮氨酸趋势,这是通过将47.69%(103位点)的编辑的氨基酸转化为亮氨酸得出的。


叶绿体基因组

叶绿体基因组


04叶绿体到线粒体的水平转移分析

观察到总长度为26.87kb的32个片段将从叶绿体基因组迁移到S.Glauca的线粒体基因组,占线粒体的5.18%。这些片段中注释存在8个基因,所有片段都是trnA基因,即trnA-UGC,trnF-GAA,trnH-GUG,trnI-GAU,trnR-ACG,trnM-CAU,trnN-GUU和trnV-GAC。数据还表明,一些叶绿体蛋白编码基因也进行了转移,即atpA, rrn16, rrn23, rpoC2, ndhA, psaB, psbB ,但是其中大多数在进化期间丧失其完整性,只有部分序列现在可以在线粒体基因组中发现。转移蛋白质编码基因和tRNA基因的不同特征表明,在线粒体基因组中,tRNA基因比蛋白质编码基因更加保守,表明它们在线粒体中具有不可缺少的作用。



叶绿体基因组


05高等植物线粒体基因组内的系统发育分析

为了解S.Glauca线粒体基因组的系统分类状态,与其他28个物种,其中22种真双子叶,4个单子叶和2个裸子植物(指定为外群)进行系统发育分析。基于来自这些物种的23个保守的蛋白质编码基因进行比对后构建系统发育树,系统发育树强烈支持双子叶从单子叶中分化,以及从裸子植物中分离出被子植物。此外,来自13个科的分类群(豆科,葫芦科,伞形科,夹竹桃科,茄科,蔷薇科,番木瓜科,十字花科,杨柳科,藜科,禾本科,苏铁科和银杏科)能被很好的聚类。系统发育树中的关系与这些物种的传统分类关系一致,表明传统分类和分子分类的一致性。


叶绿体基因组


06比较基因组分析

基因组大小和GC含量是细胞器基因组的主要特征。我们将S.Glauca的大小和GC含量与其他35种绿色植物进行了比较,包括4种藻类叶,3个苔藓,2个裸子植物,4个单子叶和22个双子叶。与陆地植物相比,藻类植物和苔藓植物的线粒体基因组通常较小。碱蓬线粒体基因组大小居中。GC含量比较发现被子植物比苔藓GC含量更高,比裸子植物更低,猜测GC含量是在苔藓向裸子植物分化过程中发生的变化。同时研究发现,相比之下,植物的线粒体GC含量更加保守,而线粒体基因组大小变化很大。与10个其他物种,包括藜科的3种植物进一步比较基因组的组成,显示碱蓬编码基因和顺式内含子的占比更高,rRNA和tRNA占比更低,同科五种有类似的模式,跟其他科又显著不同,可能是基因组大小差别较大的缘故。


叶绿体基因组

叶绿体基因组


07藜科植物中基因的加倍和丢失

比较了4个物种:C.quinoa willd, S. oleracea, B. vulgaris, and S. glauca,他们之间还是有区别的,nad7在碱蓬中是加倍的,nad1 and rps7在B. vulgaris是加倍的;C. quinoa保留最完整的基因集,仅丢失了一个sdh4基因,而atp4 and ccmC在B. vulgaris丢失,nad1 and shh4在S. oleracea中丢失,nad4, nad6, rps4, rps13, and tatC,5个基因在S. glauca中丢失。基因的加倍和丢失可能会对物种功能行使带来影响。

08蛋白质编码基因的替代速率

计算非同义取代(Ka)和同义取代(Ks)对系统发育的重建以及在密切相关的物种中的蛋白质编码序列的进化动态的理解具有重要意义。在遗传学中,可用于确定进化过程中特定蛋白质编码基因的选择性压力是否存在:Ka / Ks> 1,正向选择; Ka / Ks = 1,中性选择;和ka / ks <1,负向选择。ccmB受到正向选择,但是更多的基因是受到负向选择。因此得出结论,在绿色植物的进化过程中,线粒体基因趋于越来越高度保守的状态。

叶绿体基因组





结论


我们研究了S.Glauca的线粒体基因组的特征,这是一种作为食物源和植物修复剂的重要价值的关键盐耐受植物。根据研究数据,大多数线粒体基因组是环形的,在线粒体基因组中广泛存在的重复序列,这些重复包括串联短的和长的重复。重复序列对于线粒体分子间重组是至关重要的,丰富的重复序列可能表明线粒体基因组中经常发生分子间重组,这动态地改变序列和结构。还与其他陆地植物线粒体基因组进行了比较,结果表明S.Glauca的线粒体基因组特征与其他陆地绿色植物的线粒体基因组特征一致。

RNA编辑是一种转录后过程,发生在高等植物的叶绿体和线粒体基因组中,有助于蛋白质的更好折叠。研究RNA编辑有助于了解植物中叶绿体和线粒体基因的基因表达。以前的研究报告了拟南芥36个基因中存在约441个RNA编辑位点,水稻34个基因中存在491个RNA编辑位点。在本研究中,鉴定了21种基因内的216位编辑位点。RNA编辑位点的鉴定提供了用于预测具有新型密码子的基因功能的基本线索。作为细胞质基因组,在植物演化期间,叶绿体基因组对线粒体基因组的有迁移事件发生。我们发现将32个片段从叶绿体基因组转移到线粒体,其中包含8个tRNA基因。

此外,我们基于线粒体基因组信息分析了S.Glauca的系统发育关系。系统发育树反映了物种中有明确的分类学关系。我们还分析了在S.Glauca以及其他绿色植物中的线粒体基因组的GC含量,结果支持GC含量在高等植物中高度保守的结论。 Ka / Ks分析和与其他植物线粒体基因组特征的比较提供了对植物线粒体演化的全面了解。本研究中的大多数结果与之前的报道一致。

研究意义

在作物中,解析线粒体基因组对于植物育种至关重要,对线粒体基因组的研究对进化分析、细胞质雄性不育和植物育种的分子生物学有重要意义。即使S.Glauca不是作物植物,但他具有可食用的价值、生态恢复价值,作为具有突出耐盐性的模式植物研究价值。其线粒体基因组的完成为在S.Glauca中进一步研究基因组遗传奠定基础。因此,本研究提供了对该植物的研究的基本背景信息,有助于促进破译植物中的耐盐机制。

小结

该文思路是对线粒体基因组从分子进化层面进行解析,阐述其基因组的基本特征,以及可以用来做分子进化,其系统分类结果和传统分类结果具有一致性,证明其在这方面的功效,为植物全面遗传信息的破解提供了信息资源。

该文整体分析内容具有一定的广泛使用性,适用于我们刚刚做完叶绿体基因组,无需扩展更多领域知识,直接可以马上上手再做一篇同等类型研究的文章,并且文章直接定位在BMC Genomics上,投入小、产出大、见效快!

The end

如果您对线粒体基因组分析有兴趣,如果您想开拓新的研究,如果您想寻求一家专业的线粒体基因组分析公司进行合作,那就不要犹豫啦,集思慧远就是您最值得信赖的那个公司,欢迎来电咨询:025-85380280。