国内或国外 期刊或论文

您当前的位置:发表学术论文网农业论文》 藜属植物叶绿体基因组结构与系统进化> 正文

藜属植物叶绿体基因组结构与系统进化

所属分类:农业论文 阅读次 时间:2021-07-30 10:42

本文摘要:摘要高等植物的叶绿体基因组主要遗传自母本,具有基因组

  摘要高等植物的叶绿体基因组主要遗传自母本,具有基因组小、结构简单、序列高度保守等特点。利用系统的生物信息学方法,对4种藜属植物的叶绿体基因组进行了编码基因组成、基因组结构、重复序列、变异位点在内的比较基因组学研究,以及基于叶绿体基因组序列的藜亚科植物的系统进化研究。结果表明,4种藜属植物叶绿体基因组平均大小151936bp,平均GC含量为37.16%,具体基因的拷贝数和总的基因数目差异很小,非常保守。除灰绿藜以外,其余3种藜属植物叶绿体基因组的LSC、SSC和IR区域的边界几乎完全一致,没有表现出明显的扩张与收缩。基因组的重复序列中,相较于SSR,长重复序列片段的比例更高。相比较IR区域,4种藜属植物的LSC和SSC区域之间存在更大的核苷酸位点差异;52~59kb的基因组区域为4种藜属植物间核苷酸位点变异最大的区段。基于全基因组和LSC+SSC序列,分别构建了包括4种藜属植物在内的藜亚科植物的系统进化树,进化关系完全一致。本研究结果揭示了藜属植物叶绿体基因组的进化特征,可为藜属植物系统进化研究提供优良的候选分子标记。

  关键词藜属;叶绿体基因组;变异位点;重复序列;系统进化

植物保护论文

  高等植物中,叶绿体基因组主要遗传自母本材料,具有基因组小、基因组结构简单且保守、组成核酸序列和编码基因变异小等特点[1]。高等植物的叶绿体基因组主要由4个独立的区域构成,包括一个大单拷贝区域(largesingle-copy,LSC),一个小单拷贝区域(smallsingle-copy,SSC),以及两个分开的反向重复区域(invertedrepeata/b,IRa/b)。因为叶绿体基因组很小,保守的基因组序列和基因组成的特点,其非常适合用于复杂的植物群系进行系统进化研究[1-3]。

  藜属植物(Chenopodium)分类学上属于藜亚科(Chenopodioideae)一年生草本植物,其籽粒可用作粮食。在公元前5000年左右的南美洲,藜属的藜麦(Chenopodiumquinoa)被当地土著居民作为主粮,被称为“粮食之母”。20世纪70年代,藜麦被美国航空航天局选为太空主食。2013年,联合国粮农组织冠名该年份为“国际藜麦年”,以突出藜麦的重要性。目前,主流观点认为藜麦是一种全营养食物,可以满足人类日常的大部分营养需求[4-7]。同时,藜麦还具有优良的抗逆性,作为主粮作物开始在全世界范围展开种植[8-9]。2019年,联合国粮农组织统计数据显示全世界共种植184585公顷,年产量161415吨(www.fao.org/statistics)。此外,研究表明藜属的其它物种也富含高价值的营养物质[10-13]和良好的抗逆性[14]。近年来藜属植物的研究在全球范围内广泛开展,包括种子营养价值、抗逆性评估和育种推广等方面。

  截止2021年1月18号,NCBI的叶绿体基因组数据库中共有4,650个高等植物的测序记录(www.ncbi.nlm.nih.gov/genome),叶绿体基因组大小平均值为152.08kb,GC含量平均值为37.44%,平均分布83个蛋白编码基因。Asarumminus(NC_037503.1)的基因组最小,只有15.55kb,GC含量32.28%,分布着7个蛋白编码基因。Pelargoniumtransvaalense(NC_031206.1)的基因组最大,有242.58kb,39.89%的GC含量,分布着132个蛋白编码基因。目前,藜属植物中已有包括.album(灰藜)、.ficifolium(小叶藜)、.glaucum(灰绿藜)、.quinoa(藜麦)在内的4个物种的叶绿体基因组完成测序。本研究基于系统的比较基因组学研究方法,对4种藜属植物的叶绿体基因组进行了编码基因组成,LSC、SSC和IR区域边界比较,SSR和长重复序列挖掘和基因组范围内的变异热点区域鉴定的研究。基于全基因组和LSC+SSC序列,构建了包括4种藜属植物在内的藜亚科植物的系统进化树。本研究结果阐明了藜属植物叶绿体基因组序列特征和进化特点,可为更为广泛的藜属植物的系统进化提供优良的候选分子标记序列。

  1材料与方法

  1.1藜属植物叶绿体基因组序列从NCBI的基因组数据库(www.ncbi.nlm.nih.gov\genome)下载了4种藜属植物的叶绿体基因组序列,具体物种信息和序列编号如下:C.album(灰藜,编号:NC_034950.1),.ficifolium(小叶藜,编号:NC_041200.1),.glaucum(灰绿藜,编号:MN422308)和.quinoa(藜麦,编号:NC_034949.1)。

  1.2藜属植物叶绿体基因组序列组成和编码基因利用Mummer3.0[15]将4种藜属植物叶绿体基因组序列,分别和各自的叶绿体基因组序列进行两两比对,确定LSC、SSC和IR区域的边界。基于课题组编写的Python脚本,对4种藜属植物叶绿体基因组的基因组大小,GC含量,LSC、SSC、IR区域大小,总的基因数目,基因的拷贝数进行统计和可视化。

  1.3藜属植物叶绿体基因组LSC、SSC和IR边界差异基于Mummer3.0[15]的比对结果,利用Perl语言的SVG模块,分别进行了4种藜属植物叶绿体基因组的LSC、SSC和IR区域边界的可视化,包括LSC、SSC和IR区域大小的扩张与收缩,定位在边界上的基因差异。

  1.4藜属植物叶绿体基因组重复序列和变异位点的挖掘利用Perl语言编写的脚本MISA,进行了叶绿体基因组序列中重复单元为1~6碱基的SSR(SimpleSequenceRepeat)序列的检测。利用REPuter[16]进行了叶绿体基因组序列中长片段重复序列的检测。具体参数设置为:检测正向、反向、互补、回文4种类型;最短重复单元至少包含30bp;最大检测重复序列数目为1000;重复序列相似性至少为90%。利用MAFFT[17]软件进行了叶绿体基因组序列的比对;基于比对结果,利用DnaSP6[18]进行了变异位点的挖掘和可视化,参数默认设置。

  1.5基于叶绿体基因组的藜亚科植物的系统进化树构建从NCBI的基因组数据库(www.ncbi.nlm.nih.gov\genome)下载了另外的12种藜亚科植物的叶绿体基因组序列,具体物种信息和序列编号如下:Spinaciaoleracea(NC_002202.1),Dysphaniabotrys(NC_042166.1),.pumilio(NC_041159.1),.ambrosioides(NC_041201.1),Salicorniabigelovii(NC_027226.1),.europaea(NC_027225.1),Haloxylonammodendron(NC_027668.1),.persicum(NC_027669.1),Suaedamalacosperma(NC_039180.1),.japonica(NC_042675.1),.salsa(NC_045302.1),和.glauca(NC_045303.1)。以Dianthuscaryophyllus作为外群,基于包括藜属植物在内的16种藜亚科植物的叶绿体全基因组序列,利用MAFFT软件[17]进行了基因组序列的比对;比对结果经过trimAl软件[19]进一步优化处理,调整比对结果。基于优化后的比对结果,利用IQ-TREE1.6.12[20],构建了藜亚科植物的ML(maximumlikelihood)系统进化树,Bootstrap值设置为1000,建树最优模块由IQ-TREE内置的ModelFinder[21]进行选择。

  2结果

  2.1藜属植物的叶绿体基因组

  从NCBI的Genome数据库中一共下载了4种藜属植物.album、.ficifolium、.glaucum、.quinoa的叶绿体基因组,对其叶绿体基因组序列和编码基因的进行了统计和比较。

  2.2藜属植物叶绿体基因组的编码基因

  藜属植物的叶绿体基因组的编码基因主要包括三大方面:①Self-replication、②Genesforphotosynthesis和③Othergenes。统计表明,非编码RNA和蛋白编码基因在藜属植物中存在着双拷贝基因。比如:rRNA基因rrn16,rrn23,rrn4.5,rrn5;tRNA基因trnAUGC,trnICAU,trnIGAU,trnLCAA,trnNGUU,trnRACG;small/largesubunitofribosome编码基因rps7,rps12和rpl2;蛋白编码基因ndhB、ycf1、ycf2。此外,非编码RNA和蛋白编码基因在不同藜麦物种之间还存在着拷贝数目的差异和物种特异性的丢失。trnGUCC在.quinoa中丢失;trnfMCAU在C.quinoa只存在一个拷贝,在其余三种物种中都丢失了;trnMCAU在C.quinoa中只存在一个拷贝,在另外三个物种中却存在两个拷贝。

  2.3藜属植物叶绿体基因组LSC、SSC和IR之间的边界扩张与基因重排我们进行了4个藜属物种叶绿体基因组LSC、SSC和IR边界的扩张与基因重排比较。

  4个藜属物种的每个基因组都包含完整LSC区域(83,579bp~83,676bp)、SSC区域(17,892bp~18,107bp)和两者之间的IR区域(25,092bp~25,205bp)。4个藜属物种之间,LSC、SSC和IR区域没有显示出明显的扩张或者收缩,显示出属内植物的叶绿体基因组结构的高度保守性。此外,对4个藜属物种的LSC、SSC和IR之间的边界进行了可视化和比较。结果表明,.album、.ficifolium、.quinoa三个物种的在LSC、SSC和IR之间边界处的基因分布位置和基因长度几乎完全一致。相比较上述三个物种,.glaucum叶绿体基因组的LSC/IRb边界处基因分布存在一定的基因重排。rps19基因分布在正链,靠IRb区域一侧;rpl22则出现在了负链,靠LSC区域一侧。

  2.4藜属植物叶绿体基因组的重复序列

  利用MISA程序进行了藜属植物叶绿体基因组中SSR序列的检测,结果如表3所示。在4个物种叶绿体基因组中只发现了重复基序分别为1、2和3个碱基的SSR序列,其中重复基序为3个碱基的SSR只在.ficifolium和.glaucum叶绿体基因组中存在。.album、.ficifolium、.glaucum和.quinoa叶绿体基因组中总共分别分布着33、32、49和31处SSR序列,大小分别总计359bp、360bp、539bp和337bp。

  4种藜属植物中SSR的绝大部分为重复基序为1个碱基的SSR;重复基序为2和3个碱基的SRR序列数量非常少。重复基序为1个碱基的SSR在.album、.ficifolium、.glaucum和.quinoa中分别分布着32、28、45和28个,大小分别总计345、307、484和299bp(表3)。在.album、.ficifolium、.glaucum和.quinoa中,分布在LSC区域的SSR大大超过了在SSC和IR区域的数量,分别分布着21、19、38和17处SSR。此外,4个物种叶绿体基因组中分布在基因间区域的SSR也远超在基因编码区域的数量。

  3讨论与结论

  目前,高等植物物种亲缘关系的聚类分析,主要基于细胞核和细胞器(叶绿体、线粒体)基因组序列衍生出的包括RAPD(RandomAmplifiedPolymorphicDNA)、SSR和SNP(SingleNucleotidePolymorphism)在内的多种分子标记。叶绿体基因组在同属乃至同科植物中,其基因组大小、编码基因都显现出高度的保守性,包括本研究的Chenopodium、以及Aster[22]、Fritillaria[23]、Lilium[23]等属植物;同时,叶绿体基因组存在一定的核苷酸位点变异,非常适合进行近缘同属、同科植物的系统进化分析。本研究发现4种藜属植物叶绿体基因组LSC和SSC区域的核苷酸序列存在丰富的变异位点。我们将藜亚科植物叶绿体基因组的LSC和SSC区域单独提取出来,进行系统进化树的构建(.caryophyllus作为外群),获得了和全基因组序列构建的系统进化树一致的亲缘关系结果,且分支的支持率都达到了100。

  表明藜亚科植物的LSC和SSC区域丰富的核苷酸变异位点完全可以进行精确的藜亚科植物的系统进化分析。锦葵科(Malvaceae)木槿属(Hibiscus)的大麻槿(.cannabinus)、木槿(.syriacus)在传统分类学上被认为具有最为相近的亲缘关系,但是,基于叶绿体全基因组序列的锦葵科植物的系统进化树表明[24]:大麻槿(.cannabinus)与Taliparitihamabo、Abelmoschusesculentus有着更近的亲缘关系;而不是木槿(.syriacus)。

  两者之间的叶绿体基因组比对发现:在SSC区域存在着一个23kb左右的核苷酸高变异区域;该区域编码了15个蛋白编码基因,2个rRNA和4个tRNA。伞形科(Apiaceae)羌活属(Notopterygium)是我们国家特有的濒危多年生植物。宽叶羌活(.franchetii)、卵叶羌活(.oviforme)、羌活(.incisum)、澜沧羌活(.forrestii)的叶绿体基因组研究表明[25]:基因组之间核苷酸位点的差异主要集中在非编码区域;在LSC、SSC和IR区域都发现了高变异的核苷酸位点,其中SSC的变异位点最为富集。

  基于叶绿体全基因组和LSC+SSC区域构建的14种伞形科植物(包括上述4种羌活属植物在内)的系统进化树呈现出一致的亲缘关系结果。目前,随着高通量测序技术的发展和测序成本的降低,高等植物叶绿体基因组序列逐渐被解析;同时,仍然有大量的高等植物叶绿体基因组还没有完成测序。那么,基于近缘同属或者同科物种的叶绿体基因组的多序列比对,挖掘出核苷酸变异的区域,进行这些候选分子标记区域的扩增和测序。联合多个测序扩增片段中的核苷酸多态性,进行系统进化树的构建,实现同科或同属的植物的系统进化分析。相比较于叶绿体基因组测序,基于近缘物种的分子标记的挖掘和后续的PCR扩增,该研究策略的试验成本大为降低,目前已经取得了不错的研究成果。

  在猕猴桃研究中,Tang等人[26]对9个猕猴桃种的叶绿体基因组进行了全基因组范围内的差异位点的挖掘,鉴定得到24个高变异的基因间区域;基于其中4个区域(ndhF-rps32、ndhC-trnV(UAC)、rps16-trnQ(UUG)和trnE(UUC)-trnT(GGU))的扩增结果,对46个不同猕猴桃种进行了亲缘关系的系统进化分析,物种的聚类结果和基于核基因组SNP的聚类结果[27]大体上一致。同时,相比较之前的基于单基因序列的建树结果[28],该研究结果和基于核基因组SNP的聚类结果进一步证明了自然界中猕猴桃物种之间存在相互杂交导致的种间网状进化关系。

  植物种植论文范例:植物精油在粮油食品抑菌中的应用

  本研究4种藜属植物的LSC和SSC区域丰富的核苷酸变异位点,尤其是52~59kb区域变异最大的基因组片段,可以作为候选的分子标记进行开发,在更大范围的藜属或藜科植物材料中进行系统进化分析。本研究结果表明,4种藜属植物叶绿体基因组平均大小151,936bp,平均GC含量为37.16%。相比较SSR,基因组序列的重复序列主要为长重复序列片段。藜属植物的LSC和SSC区域的核酸序列相比较IR区域显现出更大的变异;在52~59kb区域含有4种藜属植物变异最大的核酸片段。同时,灰绿藜在全基因范围显示出和其它三个藜属植物存在较大的位点差异。包括4种藜属植物的藜亚科植物的系统进化树表明:藜属的4个物种和Spinacia、Dysphania两个属的物种亲缘关系较近;同时,进一步支持灰绿藜和其它三个藜麦属物种存在相对较远的亲缘关系。

  参考文献[References]

  1DaniellH,LinCS,YuM,ChangWJ.Chloroplastgenomes:diversity,evolution,andapplicationsingeneticengineering[J].GenomeBiol2016,17(1):134

  2JansenRK,CaiZ,RaubesonLA,DaniellH,DepamphilisCW,Leebens-MackJ,MullerKF,Guisinger-BellianM,HaberleRC,HansenAK,ChumleyTW,LeeS-B,PeeryR,McNealJR,KuehlJV,BooreJL.Analysisof81genesfrom64plastidgenomesresolvesrelationshipsinangiospermsandidentifiesgenome-scaleevolutionarypatterns[J].PNatlAcadSciUSA2007,104(49):19369-19374

  3CuiYX,ChenXL,NieLP,SunW,HuHY,LinYL,LiHT,ZhengXL,SongJY,YaoH.ComparisonandPhylogeneticAnalysisofChloroplastGenomesofThreeMedicinalandEdibleAmomumSpecies[J].IntJMolSci2019,20(16):4040

  4YangXS,ZhuKL,GuoHM,GengYL,LvW,WangSY,GuoYQ,QinPY,RenGX.CharacterizationofvolatilecompoundsindifferentlycolouredChenopodiumquinoaseedsbeforeandaftercookingbyheadspace-gaschromatography-ionmobilityspectrometry[J].FoodChem2021,348:129086

  作者:蒋礼玲1**王琳超2黄新荣1杨宇若2王明雪1,4贾举庆3黄胜雄

转载请注明来自发表学术论文网:http://www.fbxslw.com/nylw/27622.html