服务热线:18061729102/ 025-85380280
技术支持

长裂苦苣菜叶绿体基因组全序列阐明其和菊科近缘种的 进化关系

发布日期:2021-12-22 浏览次数:632


长裂苦苣菜叶绿体基因组全序列阐明其和菊科近缘种的   进化关系


文章简介

本文是甘肃农业大学生命科学学院宿老师2021年12月1日发表在 《Biomed Research International 》(IF:3.411)的文章。该文章研究思路:通过我司叶绿体高级分析模板发了一篇3分文章,主要内容是测序了长裂苦苣菜的叶绿体基因组,对基因组进行特征描述,与其他6个亲缘物种IR边界分析研究其基因水平差异,构建系统进化树分析进化关系。

原文链接:https://doi.org/10.1155/2021/9410496

技术路线


摘要

长裂苦苣菜(Sonchus brachyotus)具有食用和药用两种特性,在中国分布广泛。本研究组装了S. brachyotus 完整叶绿体基因组,长度151,977 bp,, LSC 长 84,553 bp, SSC 长 18,138 bp, IR 长 24,643 bp.;编码132个基因分别是87 个PCGs、37个 tRNA 、8个 rRNA ;GC含量37.6%。共鉴定出100个microsatellites、4个二核苷酸、67个三核苷酸、4个四核苷和1个长重复序列。LSC区的SSR频率明显高于IR区和SSC区,共有175个SSR和高度可变区域认为是潜在的cp标记。IR/LSC 和 IR/SSC 边界分析S.brachyotus与其他6个物种存在结构差异;系统进化树分析发现,S. brachyotus与S.arvensis和S. oleraceus.亲缘关系最近。本研究提供了S. brachyotus完整的cp基因组资源,这有助于识别潜在的分子标记及S. brachyotus与其近缘种进化模式。


研究背景

    苦苣菜属(Sonchus L)是菊科一年生、二年生或多年生草本植物的一个属,包括95个种,广泛分布在欧洲、亚洲、非洲和太平洋岛屿,其中Sonchus arvensis、Sonchus asper、SonchusBrachyotus、Sonchus lingianus、Sonchus oleraceus、Sonchus palustris、Sonchus transcaspicus、andSonchus uliginosus八个在中国。《中国植物志》记载,它们分布在中国东北、西北、华北、华中和华南等地区,生长在资源十分丰富的山坡、路旁和田野上。

在中国S. brachyotus不仅可以作食物也可以作治疗疾病的药物,含有许多对人体健康和新陈代谢的主要和微量元素,通常用在保健品中。S. brachyotus的化学成分已经报道,但S. brachyotus 和S. arvensis 形态相似,难以区分,它们的系统发育关系并不十分清楚。

    叶绿体是重要的质体,通过光合作用为植物生长提供必要的能量,在植物的生长和发育中起至关重要的作用,同时是半自主细胞器,具有遗传信息表达系统;与核DNA比DNA为单亲遗传。在基因类型、组织、结构方面比线粒体和核基因组更保守,因此cp基因组已成为重建植物种间系统发育关系的重要手段。

本文对S.brachyotus的完整cp基因组进行测序和分析,根据42种菊科植物的cp基因组重建了菊科植物的系统发育,讨论了:S.brachyotus 基因组特征;提供多少潜在的SNP;苦苣菜属的cp基因组中发生了哪些类型的结构变异事件等问题?

材料和方法

材料制备

植物材料从中国甘肃省兰州市安宁区黄河岸边移植而来,摘取新鲜叶组织(1-2克)送往中国南京Geneponeer Biotechnologies 进行测序。

DNA提取、基因组测序和注释

CTAB法提取总DNA,Illumina NovaSeq 6000测序,NGS QC Toolkit_v2.3.3对原始数据进行修剪获得高质量的Reads,SPAdes v3软件组装基因组,MUMmer v3.23比较基因组参考序列的保守性和基因组重排的共线性,BLAST v2.2.25 、HMMER v3.1b2、Aragorn v1.2.3 软件注释基因组,通过与参考cp基因组的比较,手动检查和调整注释初稿,然后获得注释结果。

重复结构与序列分析

Vmatch v2.3.0检索基因组的重复结构,定位各种类型的重复序列,MISA v1.0 预测各种类型的SSR,参数是1–8、2–5、 3–3、 4–3、 5–3、 6–3。

高度发散区域的识别

使用已发表的苦苣菜属6种cp基因组序列 NC_042383、(NC_042382、NC_042381、(NC_042244、NC_054161.1、(MG878405、与S. brachyotus做IR边界分析;使用Mauve 2.3.1评估基因排列顺序和序列差异。MAFFT v7.427确定分歧热点,DnaSP v5 分析PI值。

系统发育分析

S.brachyotus和已发表的 42个菊科叶绿体全基因组构建BI和MP系统进化树。

结果


    测序产生 7.5 Gb数据量,24,858,121 clean reads,基于从头和参考导向装配获得叶绿体基因组。S. brachyotus叶绿体基因组上传NCBI,登录号MT850048。基因组全长151,977 bp,典型的四分结构LSC长 84,553 bp, SSC长18,138 bp,IRa / IRb长24,643 bp,31.3% T、 31.1% A、18.7% C、18.9% G,GC 含量为37.6%;LSC、SSC、IR的GC 含量分别为35.71%、31.44%、43.08%。

S. brachyotus 含132个基因,比莴苣菜属其他6个物种多1-2个基因,包括 87个 PCGs, 8个 rRNA  37 个tRNA;8个 PCGs, 7个 rRNA  4 个tRNA 在IR区复制。113个独特基因,16个基因含有1个 intron,ycf3和clpP 有 2个 introns,这些内含子基因大多位于LSC区。

    共检测到175个microsatellites。最常见的SSR是单核苷酸有100个,占SSR的57%,第二是三核苷酸型有67个尤其是TAA,其他类型比例相对较低。值得注意的是SSR主要分布在编码区((46.5%)),基因间区域(41%),非编码内含子中数目比较少,占总量的12.6%。SSR在cp基因组中分布不成比例,LSC区最多,其次是IR和SSC区域 (Figure 2(a))。

    检查了S. brachyotus中的正向、回文、互补和反向重复 (Figure 2(b)),鉴定了35对重复序列,包括16个回文重复和19个正向重复,未发现互补和反向重复。长度从30到24643 bp不等。最常见是30 bp(约34%),其次是43 bp(11%)和31-42 bp(约小于10%),而43-24643 bp相对较少。它们主要分布在非编码区,如基因间隔区和内含子,然而,一些PGCs和tRNA如asycf2、ycf3、psbN、psaB、psaA、ndhA、rpI16和tRNS,也有重复序列。

    cp基因组的边界相邻基因的扩展收缩导致不同植物谱系之间基因组大小的差异。S. brachyotus与其他 6 个已发表的莴苣菜属边界相邻基因比较分析连接区域的收缩/扩张及多样化(Figure 3)。整个基因组结构、顺序、数量都是保守的,IRb/SSC和IRa/LSC边界也是保守的。6个物种LSC区域中rps19基因扩增,在IRb区产生了87和89 bp的产物,S. brachyotus 中该基因在 LSC区距接头31 bp。7种物种中,IR区的rpl2基因距离LSC分别为27、145、146和147 bp,LSC区trnH基因从IRa/LSC边界收缩1、2、3和32 bp。在S. oleraceus,S. boulosii,S. canariensis,S. acaulis, S. arvensis跨越SSC/IRb连接的YCF1基因长度为44 bp,S. brachyotus、S. webbii 分别是11 和 2 bp。ndhF在SSC区内,距IRb/SSC边界分别为0.5和14bp。ycf1基因延伸到SSC和IRa区域之间的边界。trnN基因完全在IRa ,收缩了793–814bp。莴苣菜属7个基因组中IR/SC边界变异导致四个区域和整个基因组序列长度差异。

    7个莴苣菜属叶绿体基因组高度相似,表明基因组结构在基因序列水平上保守 (Figure 4)。SC 区域不如 IR 区保守,最大的差异区域为5000-20000、25000-40000、45000-80000和110000-130000 bp。基因组产生113个SNP位点,pi值范围0-0.099(ycf1)。与LSC和SSC区相比,IR区可变位点数量更为保守,ycf3、matK、rpl36、ndhF、YCF1是5个高度可变位点。ycf3、matK和prl36位于LSC区,ndhF、ycf1位于SSC区(Figure 5)。变异最大的区域(Pi>0:02)有五个可变位点作为莴苣菜属系统发育研究的潜在分子标记。


    进化树显示了菊科14属43种的系统发育关系,它们聚集成3个分支。第一支由4属18种组成属于莴苣族,第二支由4属11种组成,第三支由6属14种组成。菊花和艾属属于春黄菊族,火绒草属和香青属属于旋覆花族,紫菀属属于紫菀族,向日葵属为向日葵族,都是菜蓟族成员。莴苣菜属在系统发育树的第一个分支上,S. brachyotus与S.arvensis和S. oleraceus形成的小分子关系密切,推断它们之间的关系最为密切。



讨论

    菊科作为植物第二大家族约有1620属23600种,该家族成员的cp基因组序列在GenBank中存储很少,L.sativa是第一个序列,但S.brachyotus未报道。本研究使用高通量测序对S.brachyotus 叶绿体基因组进行测序。近源物种比较发现S.brachyotus 的基因组结构及基因比较保守,有相同的PCGs、tRNAs和rRNAs。

    基因组大小存在差异表明遗传差异,这可能是由于边界区域收缩/扩张造成。cp基因组长度与非编码区的收缩/扩展有关。最近研究表明,IRb/SSC和IRa/LSC区是序列长度差异的主要原因,Cho等人对5种山楂属植物的cp基因组LSC、SSC和IR区进行边界分析,发现rps19、rpl、,trnH、ndhF、ycf1基因在位置或长度上存在一些细微差异。整个基因组结构、数量、顺序几乎相同。7个基因组在IRb/SSC和IRa/LSC边界处表现出明显的偏差。

先前研究表明,物种间鉴别的多序列比对可揭示突变热点的发展,并可用于系统发育或系统地理学研究。目前一些研究表明,叶绿体基因组衍生的标记也可用于系统发育研究。通过比较核苷酸多样性值(Pi),确认许多可变位点(如ycf3、matK、rpl36、ndhF和YCF1),其中,YCF1和YCF3已被证明是莴苣菜属系统发育研究的有效标记,有助于分析S. brachyotus.的种内变异。根据研究结果筛选出5个发散热点,说明S. brachyotus信息标记系统的巨大潜力。

    与42种菊科植物比较发现S. brachyotus分类地位和进化关系,43种菊科植物分为3个类群,种间系统发育关系与之前研究结果一致。James等人根据cp基因组构建了13种菊科植物的系统发育,S.oleraceus与L.sativa亲缘关系较近。莴苣菜属与蒲公英属亲缘关系较近,随后是莴苣属。S.arvensis与S.brachyotus 亲缘关系较近,紧接着是S.oleraceus。S. brachyotus与S.arvensis 生理学上相似,菊科植物鉴定的系统发育关系及其与菊科其他属的系统发育关系可以促进进一步研究,cp基因组序列为理解菊科植物的进化提供了有用的遗传信息。

    公司目前业务涵盖各组学测序服务、生理生化检测服务、分子实验外包服务以及生物大数据分析服务。主要产品涉及基因组学、转录组学、蛋白组学、代谢组学、表观组学、微生物组学等六大组学领域。公司2017年获得国家高新技术企业称号。公司自主开发各类实验技术以及数据分析算法,已获批27项软件著作权、受理专利4项。已为国内500多家高校、农科院、医院、医学院、药企等各类研究机构提供过科研服务