云雾林岛植物分支的重复辐射演化
来源:
时间:2024-09-29 03:56文章信息

摘要
重复辐射,其中相似形式的集合在不同区域内重复进化,可以为平行进化和群落内功能多样性的组装提供有力的见解。动物中已经描述了一些案例,但在植物中,我们缺乏有据可查的重复辐射案例,这些案例结合了全面的系统发育和生物地理学分析、一组“生态形态”独立进化的地理区域的划分以及潜在潜在机制的识别。在这里,我们记录了一组新热带植物中一组叶子生态形态的重复进化。被子植物分支荚蒾属中的Oreinotinus谱系通过分离的云林环境从墨西哥传播到阿根廷。在11个特有地区中的9个地区,具有相似叶子形状的物种是平行进化的。我们拒绝相似叶子的基因流介导的进化,并表明具有不同叶子形式的物种在其气候生态位中存在差异,支持生态适应作为并行性的驱动力。我们对植物中重复辐射案例的识别为对生命之树中的此类现象进行比较分析奠定了基础。引言
重复辐射[1,2]已在许多动物群体中得到记录,包括加勒比地区的安乐蜥蜴[3,4]、非洲裂谷湖中的慈鲷鱼[5,6]和夏威夷的蜘蛛[7,8]。在植物中,汇聚和平行进化的案例研究比比皆是,包括授粉(例如,参考文献[9])、传播(例如,参考文献[10])和光合作用(例如,参考文献[11])特定模式的重复进化。)。同样,许多研究令人信服地记录了植物谱系的快速适应性辐射和形态多样化与其地理运动的关系(例如,参考文献[12-14])。然而,这些研究并没有提供令人信服的复制辐射例子[15]。虽然一些出版物提到了植物中的这种现象[16-21],但这些案例在范围、规模或确定性上都无法与动物中的几个现在经典的例子相媲美[3-8]。一个关键的缺失要素是对不同的EndeMism区域的界定,在这些区域中,物种形成和适应导致了一组特定“生态形态”(占据不同生态位的不同形式)的重复进化[1,2]。因此,缺乏用于深入分析平行功能多样化的可比较的植物学平台,因此很难在整个生命树中广泛比较和对比此类辐射[15]。在这里,我们记录了新热带植物分支中一组叶子生态形态的重复进化,这些植物通过地理类似于岛屿群岛的分离的云林环境实现了多样化。荚蒾属植物(Adoxaceae、Dipsacales)包括约165种灌木和小树,它们开着小白花,由昆虫授粉,肉质单籽果实由鸟类传播[22,23]。荚莲属植物的两个谱系在约40迈尔前的始新世[24]时期从亚洲进入北美。在这些主要谱系之一中,Oreinotinus分支[25]从中新世晚期(~8-12Ma)开始从墨西哥向南传播,并迅速多样化[26]。这种辐射既不是由形态创新[25,26]触发的,也不是由染色体数量或基因组大小[27]的新变化触发的。相反,它似乎是由多种因素共同推动的[28,29],包括向斑块分布的云林环境的转变(其特点是冠层云层频繁覆盖和有限的季节性,但每日温度波动较大[30,31])和常绿习惯的演变[32]。如今,约42种Oreinotinus物种主要分布在整个新热带地区1,000至3,000m之间,我们已为该分支确定了11个特有山区,每个地区都存在许多物种(图1a、b,方法、扩展)数据图3、补充表1和2以及补充图2)。大多数这些地区都被众所周知的低地屏障隔开,阻碍了高海拔中湿森林植物的传播,例如特万特佩克地峡、巴拿马地峡,以及牙买加和古巴的加勒比海。它们还对应于其他云林生物研究中认可的生物地理省份(例如,我们的厄瓜多尔南部和秘鲁北部地区对应于万卡班巴洼地,而我们的哥伦比亚东部委内瑞拉地区对应于参考文献[30]的东方科迪勒拉山脉;对于墨西哥,请参阅参考文献[31])。在此研究的40种Oreinotinus物种中,只有4种存在于11个区域中的1个以上区域。这种分布模式,加上这些物种在与植物功能相关的一组叶子性状方面的显着差异,为探索复制辐射的可能性提供了一个理想的系统。
结果与讨论
系统发育和生物地理学我们的系统发育分析基于跨越Oreinotinus地理范围的180个个体的群体基因组限制性位点相关DNA测序(RADseq)数据,映射到新的Viburnum lautum参考基因组草图(方法和补充表3)。对完整数据集的分析(方法、扩展数据图1和补充表3)表明,除了五个实例外,来自相同形态物种的多个种群的种质在所有情况下都形成进化枝(在补充说明1中进一步讨论)。在两种情况下(涉及V.sulcatum和V.fuscum的限制),我们将在其他地方描述新物种以反映我们的分子和形态学发现。此处鉴定为荚蒾属植物“新名称1”的标本似乎与V. reticulatum和V. ayavacense并列,但对这些关系的支持太弱,不足以保证命名法的改变。玻利维亚最近才被荚蒾属植物占据,我们将这一地区缺乏互惠单系性解释为由于持续的物种形成而导致谱系分类不完整的证据。在最后一个例子中,V. tinoides,我们的材料出现在两个不同的分支中。由于我们目前无法根据形态学或生态学来区分这些种群,V. tinoides被保留在这里,等待进一步研究,作为一个广泛分布的物种。我们的生物地理学分析是在分散灭绝分支发生(DEC)框架[33]中进行的,并使用了Oreinotinus的时间校准物种树(图1a,方法,补充图1和补充说明2和3),显示了从北部、东部的渐进运动。墨西哥和瓦哈卡州、恰帕斯州和中美洲,并从那里一次进入加勒比海,一次进入南美洲(~5Ma)。物种丰富度在较长期被占领的地区较高,而在最近被占领的地区较低,与面积大小无关(例如,瓦哈卡有7个物种,而秘鲁、玻利维亚和牙买加古巴有2个物种)。


结论
总之,我们记录了新热带地区不连续山区的一组叶子生态形态复制进化的案例。我们的例子已经在大陆范围内发生,但其情况却反映了岛屿群岛。而且,与一些岛屿系统一样,随着Oreinotinus向南扩散,我们的云林区域在不同时间被占据,这为研究不同时间阶段的多样化提供了机会。Orienotinus的快速多样化显示出非适应性和适应性辐射的元素55。我们设想,在早期的非适应阶段,随着谱系向南传播,异域分离产生的物种在很大程度上是彼此的生态替代。然而,在此过程的后期,随着分离区域内发生物种形成,叶子形状出现了反复的适应性变化。关于叶子性状的发育及这些性状与相关环境变量的具体功能如何,仍然存在许多问题。然而,这里报告的分析坚定地证实了植物中重复辐射的情况与动物中的辐射相媲美,我们预测这同样将为物种形成和功能多样化提供深入的见解。方法
RAD-seq数据叶子组织是从植物标本室样本或新采集的植物中收集的(补充表2和3),尽可能包括来自不同地理位置的多个样本。使用QiagenDNeasy植物提取试剂盒提取DNA。RADseq数据由Floragenex通过用PstI限制性内切酶消化基因组DNA,然后进行超声处理和400个碱基对(bp)的大小选择来生成。将样品与10bp条形码连接以进行多重分析。本研究中使用的180个样本(补充表3)与其他荚莲属植物样本合并,并在IlluminaHiSeq2500或4000上进行测序,以产生100bp单端读数。基因组数据被分解为样本并使用ipyradv.0.9.65进行组装。所有进一步的分析和组装统计数据仅适用于本研究中使用的180个样本。这些样本每个样本恢复了373万±326万(平均值±标准差(s.d.))读数。使用ipyrad中基于参考的组装方法将基因组读数组装成直系同源基因座。在映射到V.lautum的参考基因组草案之前,使用默认设置来修剪和过滤读数(见下文)。映射到多个基因组位置的读取作为旁系同源物被丢弃。样本中映射读数的比例差异很大(平均值=76.9%,s.d.=18.4%),但与物种身份没有强烈对应;DNA提取质量的差异可能解释了这种差异。映射读数簇之间的覆盖率相对均匀,因此样本中的簇总数(平均值=76,317,s.d.=23,849)与通过最小深度阈值6的数量相似(平均值=68,530,s.d.=21,876)。当调用共有等位基因时,我们允许每个样本最多有4个等位基因;迄今为止统计的所有Oreinotinus物种均为2n=36的四倍体,但并非所有Oreinotinus物种的倍性都是已知的[27]。最终组装的数据集包含201,009个基因座,代表非重叠基因组区域,其中至少4个样本的数据映射到参考基因组并通过了所有过滤。每个样本平均存在60,246个位点(s.d.=18,584)。该数据集代表了RADseq数据最大但最稀疏的集合。我们没有使用不同的参数设置编译数据集的多个程序集以允许不同比例的缺失数据,而是仅创建这个最大的程序集并使用ipyradanalysis工具包[56]执行下游分析,该工具包允许对位点、基因组窗口或SNP进行过滤和二次采样适用于特定下游分析工具的多种文件格式。这些过滤选项在下面的系统发育推断、PCA和ABBABABA部分中进行了描述。参考基因组组装快速冷冻的幼叶组织是从墨西哥恰帕斯州特奥皮斯卡镇附近的野生群体样本中培养的V.lautum个体(YAL1123)中收集的。该种群的凭证样本存放在耶鲁大学植物标本室(PWS3105)。组织被送往DovetailGenomics进行高分子量DNA提取和测序。制备了5个Illumina文库并对其进行测序,以生成配对末端150bp读数。使用trimmomatic[57]进行接头和质量修剪,使用ILLUMINACLIP模式去除测序接头,并从读数的前端和尾部去除质量得分<20的碱基。配对读取具有从322到568bp不等的可变插入大小,总共有31.5亿个读取对,在接头和质量修剪后代表917Gb的序列数据。使用Meraculous2软件[58]在二倍体模式下从短读长数据组装出从头基因组草案,其中kmer大小设置为73,最小kmer频率为12。Meraculous是真核基因组的全基因组组装程序,使用混合kmer/readbased方法进行组装当存在变异时,将基因组转化为非冗余单倍体或双倍体。重叠群的顺序和方向以及它们之间间隙的闭合是通过将配对末端读段映射到最初构建的重叠群来执行的。使用GenomeScope2.0[59]根据鸟枪序列数据中的kmer频率估计V.lautum的基因组大小为6.293Gb。从头基因组组装产生了542,881个重叠群,长度为3.0395Gb。这估计占总基因组大小的48%和非重复基因组大小的76%。来自短读数据的支架将其减少至482,845个支架,其中N50为11.5Kb,L50为70,032个支架。为了进一步搭建从头组装的支架,DovetailGenomics制备了三个长程配偶对芝加哥文库,并进行测序以生成2x150bp读数。芝加哥的三个文库的插入长度高达300Kb,总共有12.5亿个读对。DovetailGenomics使用从头鸟枪组装和芝加哥数据作为HiRise(版本Threepass8cd24cd4b80d)的输入进行支架分析,HiRise是专门为使用邻近连接数据支架基因组组装而设计的软件管道[60]。最后,为长程支架准备了两个HiC文库,产生额外的2.12亿个配对末端读取,跨越10-10kb插入大小,估计可提供23,864.92倍的基因组物理覆盖率。使用改进的SNAP读取映射器(http://snap.cs.)将DovetailHiC文库序列与芝加哥支架输入组件进行比对。HiRise分析了草稿支架内映射的DovetailHiC读段对的分离,以生成读段对之间基因组距离的似然模型,该模型用于识别和打破假定的错误连接,对预期连接进行评分并使连接高于阈值。使用HiC的脚手架进行了79,674个连接,将脚手架N50提高到7.3Mb,将N90提高到92Mb。一半的基因组存在于最大的121个支架(L50)中。该基因组草案的注释以及与其他已发表的基因组的比较将在其他地方发表。个体水平树推理我们根据串联序列重建了最大似然(ML)系统发育,以生成“个体样本级别”树,其中包括来自完整数据集的180个样本(补充表3)。选择这些样本是为了排除任何假定的杂交种。根据我们过去和正在进行的对普埃布拉、瓦哈卡和恰帕斯州几种荚莲属植物的高度本地化杂交群的研究[22],我们能够通过叶子、树枝和花序性状的不寻常组合准确地识别可能的杂交植物。所有来自混合群的标本都被省略,在距这些种群一定距离处采集的几种植物也被省略。使用ipyradanalysis工具包中的ipa.window_extracter模块生成串联序列比对[56]。为了计算速度,我们仅从10个最大的支架中提取数据,并过滤位点以仅维护所有样本中至少25%共享的序列,并排除存在数据少于10%的任何样本。过滤后的矩阵长度为1.8Mb,包含109,825个SNP和50.7%的缺失细胞。这种比对在GTRCAT进化模型下的RAxML[61]中使用,以根据100个引导重复的支持值推断快速爬山算法下的最佳树。该树的生根参考了来自北美东部的V.dentatatum样本[24,25]。扩展数据图1显示,除了补充说明1中讨论的五个实例之外,来自相同形态物种的多个种群的种质在所有情况下都形成了普遍得到良好支持的进化枝。物种水平的Oreinotinus系统发育为了构建物种级系统发育,我们从41个物种级谱系中各选择一个代表性标本(补充表1和2),然后使用ipyradanalysis[56]中的ipa.window_extracter模块提取100个最大的支架。在连接所有支架之前,对它们进行过滤,仅选择所有物种中至少25%共享的位点。生成的矩阵为7.6Mb,包含161,791个SNP和48%的缺失数据。我们使用GTRCAT在此矩阵上运行RAxML[61],以在快速爬山算法下推断出最佳树,并具有100个引导重复的支持值。我们使用Toytree[62]绘制生成的树(图2b)。这种串联拓扑与使用接下来描述的多物种合并方法推断的树拓扑非常匹配。使用ipa[56]中包含的ipa.treeslider,我们在643个2Mb的非重叠窗口中遍历了数据中最大的100个脚手架。我们使用共识还原方法合并每个物种的所有标本,最终为41个物种中的每一个物种提供一个代表(包括2个V.tinoides种质;见上文)。我们使用RAxML[61]重建每个窗口的树。对于多物种合并分析,我们仅选择了包含超过300个SNP的356棵树。这些树被连接起来并用作ASTRALIIIv.5.7.1[63]的输入(扩展数据图2)。标准贝叶斯散度时间方法在应用于RADseq数据集时遇到统计和计算挑战。特别是,大量短匿名RAD基因座不容易组合到系统发育分区方案中。为了规避这些问题,我们使用MEGAX[65]中的RelTime[64]对物种级串联树进行了时间校准(图1a)。RelTime根据用户提供的约束,将分子分支长度重新分配为地质时间和进化速率的分支特定组成部分。对于我们的RelTime分析,我们将Oreinotinus植根于V.dentatum(北美东部),并将分支之间的分子速率变化限制在<20倍的差异内。我们还根据之前获得的Oreinotinus冠年龄的95%最高后验密度(HPD95),将Oreinotinus可能的冠年龄限制在6.66Ma和14.82Ma之间[22]。我们对Oreinotinus的RelTime节点年龄估计与之前使用基于化石的贝叶斯测年策略获得的分支节点年龄估计高度一致[24]。使用补充图1和补充注释2中描述的测试来评估这种一致性。Oreinotinus地图和特有地区我们将我们自己的采集地点与全球生物多样性信息设施(GBIF)中提供的保存标本所附的所有Oreinotinus地点结合起来(扩展数据图3)。我们通过搜索和下载已识别物种的地点以及已知的同义词(例如,“rhombifolium”以及“tilaefolium”)和潜在的拼写错误(例如“tilliafolium”)来过滤这些标本记录。我们使用R背包坐标清理器[66]进一步过滤GBIF数据,以删除错误概率较高的点(例如,经纬度相等的地点、海洋中的点、坐标不确定度大于1km的地点)。我们还删除了在相同纬度和经度多次记录同一物种的重复点。最后,我们查阅了Oreinotinus物种的专家范围地图和描述,以确保为每个物种保留的地点与任何已知的物种范围一致。在识别不确定的情况下,我们检查了GBIF中的图像记录,以便根据我们当前的分类法正确分配标本(补充表1和2)。我们将3,034个标本记录的完整数据集输入ArcGISPro,绘制点并将最终的物种范围地图上传到耶鲁大学ArcGIS在线存储库(https:///1OLDXD0)。尽管我们的采样对于可用的数据库和馆藏来说是彻底的,但它不太可能覆盖Oreinotinus物种的全部范围。根据我们的生物地理学分析和某些地区存在连续山脉,特定特有地区(如秘鲁北部和中部)内的明显分离可能是采集不足的人为现象,而不是在这些地区的适当栖息地中真正缺乏荚莲属植物。差距。然而,在不连续山区之间的低洼地区,例如特万特佩克地峡或巴拿马地峡,缺乏荚蒾属植物的收集,这代表了物种范围的真正差距以及这些植物占据的云林栖息地之间传播的真正障碍。为了界定最初基于地形图和我们自己的实地研究的特有地理区域,我们使用在线软件InfomapBioregions67(补充图2)分析了全范围Oreinotinus的位置数据。InfomapBioregions实施二分网络和聚类算法来阐明数据中的基础结构,根据焦点类群的分布和物种丰富度将地理空间划分为生物区域。在准备用于此分析的数据集时,我们在每1km2网格单元内仅为每个物种保留一个随机选择的点,以最大限度地减少采样偏差和空间自相关的影响。该数据集和ASTRAL物种树已加载到软件中。使用自适应分辨率方法将样本发生记录分箱到单元中,使得每个单元不大于4×4°且不小于1×1°,并且每个单元包含不超过100条记录且不少于10条记录。这些参数考虑到我们数据集的规模(3,034个物种发生记录),值(软件提供的默认值)被认为最有可能减少过度拟合和欠拟合。这种聚类方法确定了十个生物区域,每个区域都有特有物种,并且在大多数情况下在我们的ASTRAL树中形成进化枝(补充图2)。只有四种物种出现在超过一个的这些区域:V.microphyllum、V.obtusatum、V.tinoides和V.toronis(补充表1和补充图3)。其中,我们注意到,基于两个不同分支中种质的放置,V.tinoides可以被认为是两个不同的物种,位于两个不同的区域(图1a和2b,扩展数据图1和2以及补充说明1)):V.tinoides(1)种质与来自哥伦比亚西部的物种有关,V.tinoides(2)种质与来自哥伦比亚东部的物种有关。然而,由于我们无法根据形态特征或生态变量将这两个分支的种质分开,因此我们保留了广义上的V.tinoides。这一分类问题的解决需要在整个范围内进行更广泛的采样,以及额外的形态和生态分析。我们认为唯一在InfomapBioregions分析中未恢复的地方性地区是瓦哈卡州(补充图2中标记为区域3),该地区聚集在墨西哥东部。我们将瓦哈卡州列为11个特有地区之一,因为有6种荚莲属植物物种是这个小地区的特有种(V.acutifolium、V.fuscum、V.membranaceum、新种1、新种2和V.sulcatum),比任何其他领域都多。该地区也被认为是其他山地植物群的特有地区,并且在地质和植被分析中与墨西哥东部和中部分开(例如,参考文献[31])。具体来说,我们注意到瓦哈卡州瓦特拉以南的这些地区之间的划分,大致以圣多明戈河排水系统(靠近圣巴托洛梅阿亚特拉)为标志。InfomapBioregions未能将瓦哈卡州识别为一个单独的区域,可能是由于该地荚蒾属植物的采样不足(该地区每个物种的出现记录最少)以及每种地方病的已知范围极其狭窄我们在该地区认识的物种。Oreinotinus历史生物地理学我们使用DEC方法重建了Oreinotinus的祖先物种范围[33](图1a)。DEC通过推断的扩散、(局部)灭绝和分支发育事件序列,模拟物种如何在系统发育分支的一组离散区域中进化。DEC模型需要输入时间校准的物种水平系统发育和感兴趣物种的离散范围数据(即离散区域的居住集合)。对于系统发育,我们使用了上面描述的标注日期的RelTime树(图1a)。使用该项目中的新地理坐标、策划的GBIF坐标和专家范围地图(见上文)来组装离散范围数据。我们在RevBayes[68]中设计了一个系统发育模型,在DEC模型下重建了Oreinotinus的历史生物地理学[33,69]。我们假设系统发育的拓扑和分歧时间与ML树相同。我们假设所有扩散率都是相等的,先验分布为指数(10),并且所有灭绝率都相等,先验分布为指数(10)。区域内(“同域”)分支发生事件以先验概率u~Uniform(0,1)发生,区域间(“异域”)分支发生事件以概率1−u发生。我们运行马尔可夫链蒙特卡罗(MCMC)分析进行3,000次RevBayes迭代,每次迭代10次移动。所有参数的有效样本量均>200。在MCMC期间对祖先范围进行了采样,然后根据物种水平时间校准的系统发育参考树进行总结和绘制。系统发育的不确定性并没有影响我们对主要祖先范围估计的主要特征(补充图3)。SNP数据的PC和UMAP分析SNP是使用ipyradanalysis[56]中的ipa.pca模块从ipyrad生成的HDF5数据库文件中提取的,并在每个不同的分析中单独过滤,以最大限度地减少每次运行中包含的子采样分类群集合中的缺失数据。正文中介绍的分析(图1c)使用过滤器设置仅保留样本子集中最小覆盖率为75%(mincov=0.75)的SNP,以及每个样本中最小覆盖率为50%的SNP。分析中的外接区域(minmap=0.5),或者在整组样本的情况下为1(minmap=1),并且要求次要等位基因频率大于2%(minmaf=0.02)。由于缺失数据是RADseq数据的常见特征,但不适应PCA等降维方法,因此我们使用ipa.pca中的“样本”插补方法在过滤后插补缺失值。根据样本分配到的群体(组)中其他个体中缺失位点的派生等位基因的频率,对每个缺失基因型的两个等位基因进行随机采样。在我们的主要分析中,每个样本都被分配到与本研究中定义的地方病地理区域相对应的11个人群中的一个。为了减少因插补中将样本先验分配到总体组而引起的潜在偏差,我们还使用kmeans聚类方法将样本分配到组进行分析。该方法首先对高度过滤的SNP集执行PCA,允许很少的丢失数据(例如,mincov=0.90),然后使用kmeans聚类根据样本在多维PC空间中的距离将样本分配到k组。然后降低过滤SNP的阈值,允许数据集中存在额外的SNP,然后使用“样本”方法再次估算缺失值,但现在使用基于kmeans的群体分配。迭代地重复此操作,允许包含和估算越来越多的数据,直到达到目标mincov设置(此处mincov=0.75)。通过ipa.pca模块提取的过滤和估算的SNP,我们对数据运行UMAP[70]或PCA[71],这是ipa.pca从scikitlearn[72]实现的。前者是一种非线性降维方法,通过捕获局部和全局结构,在二维可视化高维数据方面通常比PCA表现更好。UMAP和PCA均针对完整数据集以及仅关注较小区域(例如墨西哥、中美洲和加勒比海或南美洲)的选定样本的数据子集进行。为了减少连锁效应,每个RAD位点仅对单个SNP进行二次采样。对于图1中所示的PCA和UMAP图,“所有区域”分析包括分类在11个先前定义的区域中的178/180个样本(排除外群)。后过滤数据集有来自1,843个不同RAD位点的5,497个SNP,其中21%的数据是估算的。“墨西哥和中美洲”分析包括116个样本,其中包含来自823个连锁块的2,931个后过滤SNP,以及21%的缺失数据。“南美洲”分析包括62个样本,其中来自11,006个连锁块的37,737个后过滤SNP,以及19%的缺失数据。扩展数据图4中提供了其他PCA和UMAP分析(另见补充说明4);这些证明了对SNP进行二次采样、估算缺失数据和先验分配群体的效果有限。叶形态分析收集了来自各种来源的所有Oreinotinus物种的数字化叶子标本,包括植物标本和我们在现场拍摄的标准化图像。尽管我们获得了V.hondurense(洪都拉斯)、V.venustum(哥斯达黎加)和V.incarum(秘鲁)的形态测量数据,但这些数据被排除在我们的统计分析之外,因为我们无法获得足够质量的DNA来将它们纳入我们的分析中。RADseq分析。V.hirsutum和V.membranaceum被纳入我们的系统发育分析中,但被排除在我们的形态测量研究之外,因为我们能够获得少于五种植物的叶子测量值,这些植物很难代表其地理范围内的变异。显示物种之间杂交的任何证据的样本被省略(见上文)。鉴于有记录的荚莲属植物[73]的季节性异胚性,只要可能,叶子测量仅从位于花序正下方的叶子进行。根据其轮廓的无障碍视图,选择每个样本的一片叶子进行测量。对于标本较少的物种,我们使用了单个个体的几片叶子。最终数据集由代表647种植物的657个叶子组成,每个分类单元平均N=15个叶子(范围=7-29)(补充表5)。在插件LeafJ[75]的帮助下,在ImageJ[74]中进行了数字测量。为了正确校准测量结果,对于每个图像,使用图像帧中的标尺或图像中的其他已知测量值确定像素/厘米比。由于LeafJ的输入要求是没有背景的叶子,因此在照片编辑程序的帮助下,从样本图像(保持像素比)中套索出选定的叶子。LeafJ还需要叶柄来定向自动叶片测量;在少数情况下,所选的叶子图像没有可见的叶柄,在叶子的基部插入一个叶柄以供LeafJ使用,并且LeafJ的叶柄长度测量值被丢弃。LeafJ提供叶片长度、宽度、面积和周长的自动测量。长宽比由叶片长度/叶片宽度计算。计算边缘齿的总数并除以总刀片周长以获得齿密度。使用Python库scikitlearn[72]及其模块preprocessing.StandardScaler,我们通过scale[76]对变量进行标准化以减少偏差,将所有数据转换为平均值=0和方差=1。由于无法从我们的数字图像中准确测量毛状体密度,因此我们使用了两个分类变量。一性状有四种状态,反映了叶背面柔毛的疏密程度:(1)主脉无毛或有少量毛;(2)无毛或有少量毛。(2)叶板上疏生短柔毛;(3)密被短柔毛,但毛状体下方可见叶板,因此表面通常呈灰色或棕色;(4)浓密的短柔毛,有几层缠结的毛状体,完全遮盖下面的叶片,因此呈白色。第二个双状态特征反映了产生的毛状体类型的差异:(1)简单或二裂或很少小的无柄星状毛状体,具有很少的射线和(2)多细胞有柄星状毛状体,具有多个射线。即使大部分无毛的形式也可以被评分为这个特征,因为它们在叶缘、或在主脉的基部、或在叶柄上或在主要次脉的腋中的小窝中产生一些毛状体。由于我们的生态形态具有连续变量和分类变量混合的特征,因此我们无法使用表面方法来识别叶子形状和收敛性[77]。相反,我们使用scikitlearn[72]库中的manifold.MDS和cluster.KMeans模块进行NMDS分析。我们使用肘法来确定在NMDS中表示我们的数据的最佳组件数量;这需要多次迭代测试,改变组件的数量并确定测试不会返回明显更好结果的点(曲线的弯头)(扩展数据图5)。在这种情况下,我们使用公制应力(缩减维度中的距离差)来找到最佳组件数量。使用相同的肘部方法,通过使用度量惯性(样本到最近聚类中心的距离之和)来衡量优化程度,从而获得聚类中的最佳k数。降维和聚类这两项分析都是使用具有物种平均值的矩阵(图2a和扩展数据图5)以及包含600多个个体种质信息的矩阵(补充表5和补充图4)来完成的。k=3的聚类确定了一个簇,其中包括我们的SGE和IGE生态形态(扩展数据图5)。我们通过使用R中的stat_compare_means[78]函数在ggpubr包中实现的Wilcoxon测试来比较IGE和SGE形式的平均值,进一步探索了该簇中叶面积的分布。如扩展数据图5c所示,这恢复了显着的结果。IGE和SGE形式之间叶面积的差异。我们还使用三个连续变量进行PCA:叶片面积、长宽比和齿密度。使用Python库scikitlearn[72]及其模块preprocessing.StandardScaler,我们通过scale[76]标准化变量以减少偏差,将所有数据转换为平均值=0和方差=1。我们使用上述模块decomposition.PCA计算所有主成分轴图书馆。为了在分析中反映毛状体信息,我们使用数码显微镜手动计数近轴表面标准扇区上0.3或0.5cm圆形孔径中的毛状体,并计算毛状体cm−2150个来自耶鲁大学植物标本馆的标本,选自涵盖整个区域的34个物种。青春期的光谱。由此,我们获得了四种毛发密度状态的平均毛状体密度,如下:1=4.97、2=107.07、3=973.72和4=4466.34毛状体cm−2。该分析的结果与使用NMDS获得的结果类似,如补充图7a所示。该分析中的物种PC分数用于并行进化分析(见下文)。使用时间校准的物种水平Oreinotinus系统发育,我们使用简约和随机映射方法对四态叶形特征进行了祖先状态重建(扩展数据图6)。我们基于ML估计的“所有速率不同”字符转换矩阵模拟了1,000个随机映射,具有相等的根节点先验概率。模拟结果总结为饼图(扩展数据图6)。与简约性类似,并且由于高水平的同质性,沿着主干的祖先状态估计是模棱两可的,在这种情况下包括南美辐射的祖先。我们还对三个连续变量进行了ML重建(补充图5),并计算了长宽比、牙齿密度和叶片面积的记录值的系统发育独立对比,并实现了所有三个特征组合之间对比的线性模型(补充图5)。6).所有三个性状都在树上表现出相关的进化变化:叶面积和牙齿密度呈正相关(补充图6a),牙齿密度和长宽比(补充图6b)以及叶片面积和长宽比(补充图6b)。6c)呈负相关。所有分析均使用phytools[79]和castor[80]软件包在R中进行。为了进一步探索并行性/收敛的程度,我们使用R[46,81]的convevol包来评估四叶生态形态收敛进化的重要性。我们执行了函数convnumsig,它使用来自PCA分析的前两个主成分的参数(包括半定量的柔毛特征)来模拟布朗运动模型下沿物种级别树的进化(见上文;补充图7)。对于每种叶类型,将模拟值与卷积度量进行比较,以确定收敛的显着性。该度量指的是谱系进入给定形态空间中的区域的次数。对于此分析,我们运行了1,000次模拟并使用了两个信息最丰富的主成分。补充图7显示了系统形态空间中的这些结果。图2b中的树显示了每个物种的代表性叶子轮廓。该样本被定义为在主成分空间中最接近物种质心的欧几里德距离。叶型和生物地理演化的后验预测分析在11个特有区域中,9个区域包含2种或更多叶型的物种(N2=9),5个区域包含3种或更多叶型的物种(N3=5)。我们使用贝叶斯后验预测测试了Oreinotinus中N2和N3的观测值是否超出零预期[82]。我们定义了一个简单的零模型,该模型将历史生物地理学的系统发育模型扩展为在具有指数(10)率先验的等四状态连续时间马尔可夫过程下模拟叶类型进化。根据设计,该零模型既不允许叶子类型影响物种范围进化,也不允许物种范围影响叶子类型进化。在推断出该零模型下所有生物地理和叶型进化参数的联合后验分布之后,同一推理模型模拟了后验参数估计的每个样本的一个数据集。我们从每个模拟数据集中删除了北美东部和V.dentatum,以便与我们在Oreinotinus中观察到的N2和N3值进行有效比较。最后,我们计算所有模拟数据集的N2和N3值,以生成区域叶类型变异的零分布,以便与Oreinotinus的这些值进行比较。性状进化的区域率检验我们测试了在地理上同域的Oreinotinus谱系中,叶子性状是否进化得更快。我们从11个区域的Oreinotinus RelTime系统发育中提取了11个具有(n1,n2,...n11)类群的亚系统发育,然后估计了每个性状(对数叶片面积、对数齿)的所有亚系统发育中的性状进化布朗率密度、纵横比)使用机器学习。然后,我们类似地估计了100个重复数据集的性状进化布朗率,每个数据集都有11个随机采样的亚系统发育,具有(n1,n2,...n11)分类单元。使用区域亚系统发生相对于随机亚系统发生的更高比率的发现支持了地理同源加速性状进化的情况(补充图9)。D-统计/ABBA-BABA测试。我们使用全基因组SNP采样来测试邻近区域物种之间的混合以及区域内物种之间的基因流动(图3、扩展数据图7和补充表4)。这是使用在四分类单元不平衡子树[(((P1,P2),P3),P4)]上设置的一系列Dstatistic(ABBABABA)测试[50]完成的,其中P3分类单元预计与两个姐妹中的任何一个共享派生等位基因物种,P1或P2,具有相同的概率。P3与这两个分类群中任何一个的等位基因共享过多(即不一致)被解释为混合的证据[50]。不过,我们注意到,在来自更大系统发育背景的多个可能子树的背景下,在解释Dstatistics时应谨慎,因为它们可能因潜在渐渗供体之间的共同祖先而导致较高的假阳性率[83]。我们在ipyradanalysis[56]的ipa.baba模块中实现了Dstatistic计算,该模块是专门为分析RADseq数据集而设计的。在此工具中,从数据库中提取并过滤每个子树中样本之间共享的所有基因座,以应用最小样本覆盖阈值。当分析中多个样本代表一个分类单元时,使用等位基因频率计算匹配ABBA和BABA的位点模式。我们要求每次测试每个分类单元至少覆盖一个样本,但大多数分类单元由多个样本代表。为了评估其显着性,我们对每个测试进行了500次引导重复,其中RAD位点通过替换进行重采样。然后将Zscore计算为D偏离零的引导标准差的数量。为了可视化,我们显示了500个bootstrap重复的散点图,并且当Zscore显着时使用Z>5作为截止值,颜色点颜色更深(图3)。JupyterNotebooks中提供了可复制的代码来复制我们的结果和数据:https://github.com/eatonlab/Oreinotinusphylogeny。每个测试的统计数据可在补充表4中找到。我们首先建立了一系列15项测试来研究邻近地区物种之间的混合(图3a)。在这些测试中,P1和P2被选为来自同一地区但叶子形状不同的物种。P3被选为来自邻近地区的物种,其与P2分类群共享叶子形式。所有测试均使用V.dentatatum(来自北美东部的Oreinotinus的外群)作为P4外群分类单元。在这一系列测试中,我们只发现了一个显着结果,即V.sulcatum(瓦哈卡州)和V.tiliaefolium(墨西哥东部)之间的混合(图3b)。有关V.sulcatum中混合物的进一步研究,请参阅下文和扩展数据图7。这一系列测试平均每次测试包含131,024个SNP(s.d.=64,309),其中2.99%不一致(ABBA或BABA;s.d.=0.4%),平均每次测试包含1,983个ABBA位点和1,925个BABA位点。还对“替代系统发育假说”进行了第二系列测试,其中分析了相同的四分类单元集,但更改了P1、P2和P3子树拓扑以代表来自邻近地区的两个具有相似叶子形状的物种的情况假设共享一个最近的共同祖先(即设置为P1和P2;图3c)。如果我们推断的系统发育假说是正确的,那么我们应该会看到过多的ABBA位点,其中来自同一地区的两个物种共享更多的共同等位基因。这一系列测试的SNP数量与上述相同,但不一致的比例更大(平均值=3.89%,s.d.=0.64%),导致平均D为0.22(s.d.=0.14),平均Z-score为29.25(s.d.=0.64%)。=21.94)。为了测试同一区域内物种之间混合的证据,我们根据我们推断的Oreinotinus串联树,建立了一系列测试,对每个区域中的三个类群进行采样,匹配所需的不平衡拓扑形状(图3e)。这些测试并不是专门针对叶子形状而设置的,因此ABBA或BABA过量都被简单地解释为混合的证据。最后,我们使用Dstatistics调查了V.sulcatum中的混合物来源(扩展数据图7)。进行了一系列13项测试,将作为P3分类单元的V.sulcatum与墨西哥东部的2个对比P1和P2样本,或墨西哥东部的1个样本和墨西哥西部的1个样本进行比较。我们还以相反的方向进行了测试,以墨西哥东部和西部分类群作为P3,以V.sulcatum作为P2分类群,与远亲(来自恰帕斯州的V.jucundum)或近亲(来自瓦哈卡州的V.fuscum)进行对比。网络分析为了估计系统发育网络,我们使用ipa[56]中包含的ipa.treeslider模块,使用RAxML[61]为643个窗口中的178个个体生成了树(图3c和补充图10)。这些窗口是从我们整个数据集中100个最大的支架中提取的。每个窗口的大小为2Mb,没有重叠。我们只保留至少10个SNP的窗口和至少9个样本的覆盖范围。我们进一步过滤滑动窗口,仅保留那些具有超过300个SNP的窗口。使用共识还原将属于同一物种的所有样品还原为独特的代表性样品。总共恢复了357棵树并用作重建网络的输入。为此,我们使用MSCquartetspackage[85]中并入R[86]的NANUQ[84],将alpha设置为1×10−5,将beta设置为0.95。我们使用SplitsTree[51]使用默认参数绘制最终网络。V.jucundum、V.lautum和V.hartwegii的气候分析我们评估了墨西哥恰帕斯中部高原地区代表三种不同叶子类型的三个物种的环境生态位空间:V.hartwegii(IGE)、V.jucundum(LPT)和V.lautum(SGE)(图4和扩展)数据图8)。我们通过两种方式来描述他们的环境利基。首先,我们通过将我们自己的采集地点与GBIF[87]中所有保存的标本记录相结合,为该地区每个物种收集了地理参考地点。然后,我们使用R背包坐标清理器[66]过滤收集点并映射其余位置。这产生了230个经过审查的地点,加上我们恰帕斯州气候站的另外5个地点(见下文)。我们从CHELSA(地球陆地表面区域高分辨率气候学)[88,89]中以1km2分辨率提取了所有经过审查的地点的19个标准生物气候变量。高程数据是使用航天飞机雷达地形测量任务[90,91]分辨率为90平方米的数字高程模型获得的。使用ArcPy脚本在ArcGISPro中提取每个地点点的每个数据层的栅格值,然后我们分析R中的ArcGIS输出,使用ttest比较每组物种和每个气候变量的成对平均值,并绘制气候变量ggplot[92]中每个物种的分布。在提取环境值之前,所有数据点和栅格图层都被投影到墨西哥IRTF2008UTM15N坐标系中,在该坐标系中,墨西哥中部的高程测量应经历最小的失真。其次,为了更精细地调查当地环境变化,我们在恰帕斯州的两个V.jucundum(LPT)站点、两个V.lautum(SGE)站点和一个V.hartwegii(IGE)站点安装了5个便携式气候站(MeterEnvironment)站点(图4e,f)。气候站安装在健康、天然的单一品种荚蒾林的中央;V.jucundum和V.lautum站于2016年5月安装,V.hartwegii站于2018年1月添加。这些站不断记录数据,直到我们于2019年2月最后一次上传。每个气候站都包括一个气温传感器和一个叶子湿度传感器连接到数据记录器(Decagon/MeterGroupATMOS14、PHYTOS31、Em50数据记录器)的传感器。温度和叶湿度传感器安装在与荚莲属植物冠层高度相似的树干上,距地面约2-3m。每小时记录温度和叶子湿度测量值。我们分析了R中的站点数据。我们使用显着性水平为0.05的t检验比较站点之间每小时、每天和每月的温度和叶子湿度,以测试每个站点的气候测量值之间是否存在显着重叠。此外,对于每个气候站区域,我们将冠层覆盖率估计为冠层下方开放天空的比例,并将其用作光环境的代理(图4d)。对于每个地点,我们确定了所监测物种的三到五个个体,并为每个植物拍摄了两张鱼眼照片:一张照片位于个体以北1m处,一张照片位于个体以南1m处。照片是使用配备鱼眼镜头的数码单反相机拍摄的,使用参考文献中详细说明的方法[93]。图像被二值化,白色像素的百分比被用作开放树冠百分比的代表。我们使用R测试了站点之间树冠覆盖的显着差异,并使用ggplot[92]绘制了值。Oreinotinus整个地理范围的气候分析为了确定IGE、LPT和SGE形式是否与我们在恰帕斯州详细的三物种比较中一样存在普遍差异,我们比较了V.hartwegii、V.jucundum和V.lautum整个地理范围内的CHELSA变量(补充图12)Oreinotinus范围内的IGE、LPT和SGE物种(扩展数据图9和10)以及各个区域内的IGE、LPT和SGE物种(补充图13-15)。我们分析了整个Oreinotinus范围内3,034个精选样本的完整数据集和相关环境变量(见上文)。我们移除了V.venustum、V.hondurense和V.incarum,因为这些物种并未在树中进行采样。我们还删除了V.membranaceum和V.hirsutum,它们各自只有3个出现记录。使用R中实现的成对ttests并在ggplot中可视化,我们首先按特有现象区域(补充图11)比较环境条件,然后按所有区域的生态形态(扩展数据图9和10)进行比较。在评估了19个CHELSA气候变量中哪些在外型体之间表现出显着差异后,我们重点关注以下变量:年平均气温、平均日较差、温度季节性、温度年较差、最冷月最低温度、年平均降水量、降水季节性和海拔(扩展数据图9和10以及补充图12-15)。我们选择这些变量来包括可比研究中包含的标准气候生态位测量(年平均气温、年平均降水量、海拔),以及代表变化而不是平均值的所有指标(平均日差、温度季节性、温度年范围)、最冷月份的最低温度、降水季节性),认为这些对于确定荚莲属植物的分布可能特别重要。
期刊:Nature Ecology & Evolution
文章标题:Replicated radiation of a plant clade along a cloud forest archipelago
作者信息:Michael J Donoghue , Deren A R Eaton , Carlos A Maya-Lastra , Michael J Landis , Patrick W Sweeney , Mark E Olson , N Ivalú Cacho , Morgan K Moeglein , Jordan R Gardner, Nora M Heaphy, Matiss Castorena , Alí Segovia Rivas , Wendy L Clement , Erika J Edwards
原文链接:https:///10.1038/s41559-022-01823-x
文内图片及封面图片来源原文
相关知识
昆明植物所重构核心十字花科原始核型并揭示伴随其快速辐射演化的基因组学特征
研究发现紫外辐射影响高山植物花部特征演化
昆明植物所等在被子植物唇形分支花粉性状演化研究中获进展
昆明植物所在被子植物单子叶分支花粉性状演化研究中取得新进展
毛茛科植物花形态发育性状的演化研究
系统树长分支与被子植物演化的关系
植物的演化
紫外辐射影响高山植物花部特征演化—论文—科学网
昆明植物所在“竹子开花”现象和开花素编码FT基因演化方面取得新进展
昆明植物所揭示禾本科植物早期演化历史
网址: 云雾林岛植物分支的重复辐射演化 https://www.huajiangbk.com/newsview211471.html
上一篇: 基于气候适应的北方农村住宅节能设 |
下一篇: 来宾市降香黄檀营林分析 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039
分享热点排名