卵叶远志叶绿体基因组序列特征与系统发育分析
远志为远志科远志属多年生草本植物远志Polygala tenuifoliaWilld.或卵叶远志P. sibiricaL.的干燥根[1]。远志是我国42种重点保护的三级野生品种和85种传统出口大宗药材之一,也是目前临床益智药处方中使用度名列前3位的单味中草药,被视为养命之要药[2]。远志药用历史悠久,始载于《神农本草经》,目前已从远志药材中分离和鉴定出140多种化合物,包括皂苷类、酮类、寡糖酯类、生物碱类等[3]。其中,远志皂苷类、酮类以及寡糖酯类作为远志药材中最主要的药效成分,具有广泛的药理活性,如抗衰老、神经保护、抗抑郁、催眠镇静、抗炎、抗病毒、抗肿瘤、抗氧化、抗心律失常等[4]。
叶绿体(chloroplast,cp)是古代细菌内共生体的后代,系植物细胞中的重要细胞器,负责光合作用和新陈代谢等,为植物生存和生长提供必要的能量[5]。高等植物的叶绿体基因组中存在典型的环式双链结构,其大小在120~180 kb,由4部分构成,包含1个小单拷贝区(small single copy,SSC)、1个大单拷贝区(large single copy,LSC)和2个反向重复区(inverted repeats,IRs)[6-7]。叶绿体基因组DNA(cpDNA)独立于核基因组,表现出半自主的遗传特征,可作为物种鉴定、系统发育、起源进化等研究的依据[8-9]。研究发现,基于叶绿体基因组的分子条形码具有极佳的物种鉴定潜力[10-11],且完整的叶绿体基因组序列可以为植物物种和种群水平上的准确鉴定提供可靠的条形码[12-13]。同时,通过比较叶绿体基因组序列为发现序列变异和识别突变热点区域提供了机会,还可以检测出基因缺失和重复事件。因此,从叶绿体基因组序列获得的突变热点区域和简单重复序列(simple sequence repeats,SSR)可以作为物种鉴定和群体遗传学的有效分子标记[14]。随着二代测序技术(next generation sequencing,NGS)的普及和发展,叶绿体基因组数据库日益丰富。在解析植物类群系统发育关系研究中逐渐得到广泛应用,迄今已有1000多种植物完成了叶绿体基因组的测序,在植物系统发育地位、物种鉴定、进化分析等解析方面发挥重要作用[15]。
目前,远志研究多集中于远志及其药材,而有关卵叶远志P. sibiricaL.的研究,仅有少数是关于资源调查、化学成分和药理作用等方面[16-17],尚缺乏其叶绿体基因组及遗传背景信息的系统研究与分析。据此,本研究采用高通量测序技术以获得卵叶远志叶绿体全基因组序列信息,并利用生物信息学相关软件,分析其序列特征、基因组成及系统发育关系,以期为该药用植物的遗传结构和遗传多样性研究奠定研究和理论基础,也为将来远志属植物的亲缘关系解析及新药源寻找等提供支撑。
1 材料
卵叶远志采自陕西省太白县大贯子(N 107.2883205°,E 33.99384660°,海拔1302 m),经陕西中医药大学胡本祥教授鉴定为远志科卵叶远志P. sibiricaL.,取卵叶远志的新鲜叶片,液氮速冻后存于−80 ℃冰箱,用于DNA提取。植物凭证样本保存于陕西中医药大学标本馆(PS20211001)。
2方法
2.1基因组DNA提取和测序
取卵叶远志的新鲜幼嫩叶片,通过改良十六烷基三甲基溴化铵法(cetyltrimethylammonium bromide,CTAB)[18]提取基因组DNA,经电泳检测和浓度测定后,置−20 ℃冰箱留存备用。超声处理基因组DNA,通过末端修复、加A尾、加测序接头、纯化、PCR扩增等步骤完成文库构建,再通过Illumina高通量测序平台Illumina HiSeq测序,以此来获得序列原始数据。
2.2叶绿体基因组组装与注释
Illumina数据使用Trimmomatic v0.36[19]以去除接头和低质量数据。参数设置如下:前导:20;尾随:20;滑动窗口:4∶15;最小镜头:36;平均合格:20。处理完后的高质量clean data,使用GetCellelle对叶绿体基因组进行组装,拼接软件对优化序列进行多个Kmer参数的拼接,长度设置为107、117和127 bp。使用在线网站CHLOROBOX(https://chlorobox.mpimp-golm.mpg.de/geseq.html)对组装好的叶绿体基因组进行注释[20]。使用OGDRAW绘制叶绿体全基因组图谱[21]。最终注释的叶绿体基因组上传于GenBank中,注册号为OP870084。
2.3叶绿体基因组序列比较分析
为消除氨基酸组成对密码子使用的影响,采用MEGA11[22]分析同义密码子使用量、相对同义密码子使用值(relative synonymous codon usage,RSCU)、碱基组成和密码子含量的变化特征。使用SSRHunter软件(http://www.biosoft.net)鉴定叶绿体基因组中的SSR[23-24]。参数设置为单核苷酸至六核苷酸8、5、4、4、4、4。SC/IR边界使用IRSCOPE[25]进行作图分析。同样,通过mVISTA[26](https://genome.lbl.gov/vista/mvista/ submit.shtml)做全基因组对比,分析时勾选全局对比(Shuffle-LAGAN),对远志属9种叶绿体基因组序列做同源性对比分析。
2.4系统发育分析
从NCBI(https://www.ncbi.nlm.nih.gov/)上下载远志科远志属植物远志(NC_050829)、香港远志P. hongkongensis(NC_066219.1)、瓜子金P. japonica(NC_052912.1)、密花远志P. karensium(NC_056971.1)、西南远志P. crotalarioides(NC_ 060367.1)、合叶草P. subopposita (OP_612815.1)、黄花倒水莲P. fallax(NC_052911.1)、荷包山桂花P. arrillata(NC0_56971.1),选取楝科香椿属植物香椿Toona sinensis(NC_059806.1)和楝科非洲楝属植物非洲楝Khaya senegalensis(NC_037362.1)作为外类群,共11个物种完整的叶绿体基因组序列通过在线软件MAFFT version7 (https://mafft.cbrc.jp/ alignment/ server/)进行多序列对比[27],利用MEGA11构建邻接法(neighbor-joining,NJ)系统发育树[28],自展次数为1000[28]。
3 结果与分析
3.1叶绿体基因组的结构
卵叶远志叶绿体基因组具有典型的四分体结构(图1),由LSC区域(165、192~248、865),SSC区域(120、409~128、457),IRA(128、458~165、191)和IRB(83、674~120、408)组成。叶绿体基因组全长165 192 bp,GC含量约为36.7%(表1)。
3.2基因组成
基因注释结果显示,卵叶远志叶绿体基因组共注释得到124个基因,包括8个核糖体RNA(rRNA)基因、42个转运RNA(tRNA)基因和74个蛋白编码基因(coding sequence,CDS)(表2)。注释的基因中存在1个内含子的为trnA-UGC、trnA-UGC、trnI、trnK-UUU、trnL-UAA、trnS-CGA等,存在2个内含子的基因为ycf3和rps12。
3.3密码子偏好分析
卵叶远志叶绿体密码子研究发现,64个蛋白编码基因共编码35 541个密码子。亮氨酸(Leu)使用频率最高,异亮氨酸(Ile)次之,半胱氨酸(Cys)使用度最低,分别为3775(10.62%)、3075(8.65%)、423(1.19%)。密码子使用偏好显示,卵叶远志叶绿体基因组中RSCU>1的密码子占总量的67.29%,表现出以A、T结尾的特征(表3)。
3.4SSR分析
卵叶远志叶绿体基因组中鉴定出单、二、三、四、五、六核苷酸SSRs位点共287个,其数量分别为240、28、4、8、3、4。其中,单核苷酸重复次数最多,占比80.61%(表4)。
3.5边界分析
选取NCBI上已发布的8种远志属植物叶绿体基因组SC/IR进行边界分析,显示远志属植物叶绿体基因组存在4个边界。如图2所示,LSC/IRb区域中,除密花远志P. karensiumL.及西南远志P. crotalarioidesL.外,其余7种均位于rps19基因编码区。其中,向LSC区域扩张1 bp的香港远志P. hongkongensis L.、远志、瓜子金和合叶草;扩张2bp的为西伯利亚远志;扩张7bp的为黄花倒水莲和荷包山桂花。IRb/SSC区有4种在ndhF基因编码区,5种在ndhF基因非编码区,其中香港远志和荷包山桂花分别向IRb扩张10bp和3bp。SSC/IRa区,所有物种都在ndhG基因和ndhI基因之间的非编码区,且均向SSC区扩张,该区域无剧烈变化。在IRa/LSC,除西南远志处于ycf2基因编码区外,其他8种均在rpl2基因和trnH基因之间的非编码区,均向IRa区有不同程度的扩张。边界分析表明,远志属植物叶绿体基因组在其IR边界具有一定差异,总体而言基因边界变异幅度较小,叶绿体基因组较为保守。显示出西伯利亚远志、香港远志、远志、瓜子金和合叶草在SC/IR边界的结构上存在相似性。
3.6远志属植物叶绿体基因组变异分析
以卵叶远志(GenBank注册号为NC056970)为注释,对9种远志属植物进行叶绿体基因组全序列对比分析(图3)。结果表明,9种远志属植物叶绿体基因组的4个基因区间组成较为一致,差异性较小。从4大区段来看,LSC区差异性最大,变异程度最高,而IRA区则差异性最小,最为保守。从非基因编码区和基因编码区来看,非基因编码区变异程度较高,基因编码区较为保守,但在ycf1、ycf2、ycf3、ndhF和ndhD等基因编码区变异程度较大,存在显著差异。
3.7系统发育分析
利用邻接法构建系统发育树(图4),结果显示11个物种可分为远志科和外类群的楝科。远志科的9种远志属植物以100%支持率构成一个分支,与楝科区分开。同时,远志属中香港远志、卵叶远志、瓜子金、远志、合叶草和西南远志可聚成一支,而密花远志、荷包山桂花和黄花倒水莲则聚为姐妹支。
4 讨论
卵叶远志作为远志中药材的2种基原植物之一,具有重要的药用价值和经济价值。卵叶远志和远志分布和产地也基本相同,远志药材的质量标准中并未区分卵叶远志与远志的种间区别,也未客观确定各自的质量指标,有关药用远志的研究也主要集中在远志方面。近年来,对卵叶远志的研究也在逐渐加深[29],但目前尚缺乏关于其遗传信息的研究。基于此,本研究完成了卵叶远志叶绿体基因组的测序、组装和注释工作,并分析了其结构、GC含量、基因组成、密码子使用度、SSR等,着重对9种远志属植物进行了叶绿体基因组边界分析、变异分析及系统发育分析等。研究发现,卵叶远志叶绿体基因组为经典的环状四分结构,全长为165 192 bp,其GC含量为36.75%,共编码124个基因,其中含有一个内含子的基因有14个,含有2个内含子的基因有2个。同时,和大多数被子植物叶绿体基因组一样[30],卵叶远志中也存在未知功能基因,如ycf3和ycf4基因,仍有待进行突破性研究。
密码子是生物体中连接氨基酸、蛋白质和遗传物质的重要核心元素,在生物个体遗传信息的传递中起重要作用[31]。大多数氨基酸不仅由一种密码子编码,也可以同时由2~3种密码子编码,生物体对于不同的密码子的使用具有一定偏好性[32]。密码子偏好的研究使用为蛋白质表达及其相应功能的研究提供了可靠的信息。密码子偏好也可作为微调基因表达的手段[33],双子叶植物密码子偏好以A/T结尾,单子叶子叶植物偏好则与双子叶植物不同,偏向G/C[34]。对卵叶远志密码子分析可知,卵叶远志密码子RSCU>1的有67.29%,偏好为以A、T结尾。
目前,SSR是主要存在于基因外部和基因非编码区的共显性标记,也称微卫星,可用于群体遗传学研究的分子标记[35]。在卵叶远志叶绿体基因组中,检测出的SSRs位点共有287个,其中单核苷酸重复次数最多,占80.61%。单核苷酸主要由A和T组成,这也表明卵叶远志叶绿体基因组在碱基形成过程中A和T被频繁使用。
远志属植物叶绿体基因组的SC/IR边界,虽存在部分扩张或收缩情况,但大体来说,整个基因组仍然较为保守,卵叶远志、远志、瓜子金、香港远志和合叶草基因结构存在相似性。在对其进行全序列比对时,LSC区和非基因编码区变异程度较高,IRa区和大部分基因组编码区保守程度较高。本研究通过全序列对比,结合边界分析与系统发育结果,得出卵叶远志与香港远志聚为一支,且与远志、瓜子金具有较高的亲缘关系。与王星璐等[36]构建的进化树存在一些差异,分析其系统发育关系可知,瓜子金和卵叶远志聚为一支,二者又与香港远志聚类到一起,瓜子金、卵叶远志、香港远志和远志为姊妹类群,表明四者亲缘关系最近关系密切,推测差异原因可能与样本的采集环境及变异有关。
本研究通过文库构建、高通量测序、组装和序列分析,系统解析了卵叶远志叶绿体基因组,分析了其叶绿体基因组序列特征和系统发育关系,有助于深入开展后续分子标记、DNA条形码技术等研究,为进一步探究该药用植物卵叶远志的遗传结构和遗传多样性奠定了基础。同时,也增添了卵叶远志在分子生药学方面的部分研究,为加快对卵叶远志的研究以及在基因层面鉴别该种属提供了相关依据。
利益冲突所有作者均声明不存在利益冲突
参考文献(略)
来 源:罗 瑶,胡本祥,张 晗,史嘉周,姬海月,净易尧,陈晓颖,王帮庆,颜永刚,赵 璠,李艳茸,彭 亮.卵叶远志叶绿体基因组序列特征与系统发育分析 [J]. 中草药, 2023, 54(18):6065-6073.
相关知识
丁香属3种植物完整叶绿体基因组与系统发育研究
椭圆叶花锚叶绿体全基因组分析及谱系地理学研究
从叶绿体到进化历程:完整基因组与比较分析,揭示植物世界的变迁
科学家在蔷薇科叶绿体系统发育基因组研究中取得进展
大花君子兰叶绿体基因组及其特征
向日葵(Helianthus annuus L.)叶绿体基因组分析及分子标记开发
石仙桃叶绿体基因组进化和系统学研究获进展
武汉植物园完成城口桤叶树叶绿体基因组的解析
单子叶分支的花粉形态和演化研究——兼论泽泻目的叶绿体系统发育基因组学
非洲鞭寄生(Hydnora abyssinica)叶绿体基因组研究及菌花科(Hydnoraceae)系统地位的重新确立
网址: 卵叶远志叶绿体基因组序列特征与系统发育分析 https://www.huajiangbk.com/newsview1613642.html
上一篇: 叶绿体是绿色植物细胞特有的结构之 |
下一篇: 多花海棠叶绿体基因组分析 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039