基于特异和多态SSR序列的多种杜鹃花品种鉴定方法
本发明属于植物品种鉴定,更具体的说基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,并可以将此方法扩展到其它物种的品种鉴定中。
背景技术:
1、杜鹃花是重要的观赏园艺植物,因其花色繁多、色泽艳丽、气味芬芳而备受大众喜爱和追捧,在世界园艺界中占据举足轻重的地位。此外由于杜鹃花属植物种类繁多,是北半球木本植物最大的属,据不完全统计杜鹃花属中有1000余个物种,广泛分布于亚洲、欧洲和北美洲等地,分布生境广泛,是研究物种辐射演化的良好材料。此外,杜鹃花拥有超过三万个品种,除了极具观赏价值外,还可作药用、提取精油等,由此可见针对杜鹃花品种鉴定的研究不但具有产业价值,也具有科学意义。
2、随着分子生物学和生物信息技术的发展,分子标记技术在杜鹃花品种的划分以及培育中得到了广泛应用。传统的ssr标记开发方法需要在测序的基础上,进行引物设计和凝胶电泳,仅仅是针对特定的品种筛选标记性ssr,鉴定多个杜鹃花的品种要花费更多的时间去识别其中具有分子标记潜力的ssr,这就使得需要消耗更多的时间成本和花费成本。上述弊端迫使我们寻求更高效、准确的新型品种鉴定算法,以规避传统方法的现有缺点。
技术实现思路
1、本发明公开了基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,采用了品种内特异性ssr及品种间多态性ssr的数字特征,结合t-sne算法和k近邻算法的方案来鉴定多个杜鹃花的品种。省略了繁琐的引物合成和后续的电泳过程,节约实验时间及实验成本,并且可以通过不断的补充新的测序数据进行学习和训练,使得识别精度和识别的广度随着数据的增加而提高,提高品种鉴定的泛化性能
2、为了实现上述目的,本发明是采用以下技术方案实现的:基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,包括以下步骤:
3、步骤s01:样品采集和保存;
4、步骤s02:样品dna提取、文库构建及上机测序,获得测序读段;
5、步骤s03:从头组装测序读段,从组装序列中识别ssr;
6、步骤s04:根据识别结果,判定非复合型ssr;
7、步骤s05:计算非复合型ssr中重复单元的数字特征;
8、步骤s06:提取品种内特异性ssr及品种间多态性ssr数据;
9、步骤s07:使用t-sne算法得到训练样本的降维特征,并使用k近邻算法进行训练;
10、步骤s08:使用训练的k近邻模型对待预测样本品种进行鉴定;
11、步骤s09:重复步骤s01-s07,增加测序的个体数据和品种类型,提高杜鹃花品种鉴定泛化性。
12、进一步的,所述的步骤s01具体步骤为:针对每个杜鹃花品种的单个个体,采摘2g嫩叶放置于10ml冻存管中,液氮速冻2h后,放入-80°冰箱中进行保存。
13、进一步的,所述的步骤s02具体步骤为:对每个杜鹃花个体进行基因组dna提取、利用机械打断的方法将检测合格的dna样品进行片段化,对片段化的dna进行片段纯化、末端修复、3′端加polya、连接测序接头,然后通过pcr扩增构建测序文库并进行illumina上机测序,对原始下机读段进行质量控制,包括去除接头、排除低质量读段和污染序列,最终获得高质量的测序读段。
14、进一步的,所述的步骤s03从头组装测序读段具体步骤为:利用生物信息学软件对获得的测序读段进行从头组装,得到组装序列。
15、进一步的,所述的步骤s04非复合型ssr的判断标准是整个ssr序列中只有单一的重复单元。
16、进一步的,所述的步骤s05中重复单元的数字特征为:(a)n,a表示ssr序列重复单元,n表示重复单元的重复次数。
17、进一步的,所述步骤s06中所述的品种间多态性ssr判断公式为:
18、
19、式(1)中,sj-in表示的是第j个品种所涉及的所有个体ssr重复单元数字特征的标准差,其中的xi表示的是品种j中某个个体(i个体)重复单元的数字特征,表示的是品种j中对应重复单元的所有数字特征的平均值,nj表示的品种j中的测序个体的数量;
20、
21、式(2)中,s表示从所有个体中排除j品种所涉及的个体后,剩余个体ssr数字特征的标准方差;
22、
23、式(3)中的ij表示的示性函数,条件成立时ij=1,条件不成立的时候ij=0,cutoff为阈值。
24、进一步的,所述的阈值为0.6。
25、本发明有益效果:
26、本发明提出的方法仅仅需要dna的重测序数据,候选的品种鉴定仅仅需要计算机算法进行完成,摒弃了传统的引物设计和凝胶电泳的步骤,有效减少时间成本及实验成本。并可以不断的补充新的测序数据进行学习和训练,使得识别精度和识别的广度随着数据的增加而提高,由此提高品种鉴定的泛化性能。
技术特征:
1.基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是,包括以下步骤:
2.根据权利要求1所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述的步骤s01具体步骤为:针对每个个体杜鹃花每个杜鹃花品种的单株样品,采摘2g嫩叶放置于10ml冻存管中,液氮速冻2h后,放入-80°冰箱中进行保存。
3.根据权利要求1所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述的步骤s02具体步骤为:对每个杜鹃花个体进行基因组dna提取、利用机械打断的方法将检测合格的dna样品进行片段化,对片段化的dna进行片段纯化、末端修复、3′端加polya、连接测序接头,然后通过pcr扩增构建测序文库,并进行illumina上机测序,对原始下机读段进行质量控制,包括去除接头、排除无关读段和污染序列,获得测序读段。
4.根据权利要求1所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述的步骤s03从头组装测序读段为:利用生物信息学软件对获得的测序读段进行从头组装,得到组装序列。并设置识别ssr的参数,从组装序列中识别ssr。
5.根据权利要求1所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述的步骤s05中重复单元的数字特征为:(a)n,a表示ssr序列重复单元,n表示重复单元的重复次数。
6.根据权利要求1或5所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述步骤s06中所述的品种间多态性ssr判断公式为:
7.根据权利要求6所述的基于特异和多态ssr序列的多种杜鹃花品种鉴定方法,其特征是:所述的阈值为0.6。
技术总结
简单重复序列(SSR)是众多物种中广泛分布的基因组序列重复模式。本发明公开了基于特异和多态SSR序列的多种杜鹃花品种鉴定方法,属于植物品种鉴定技术领域。采用了品种内特异性SSR及品种间多态性SSR的数字特征,结合t‑SNE算法和K近邻算法的方案来鉴定多个杜鹃花的品种。摒弃了传统的引物设计和凝胶电泳的步骤,有效减少时间成本及实验成本。并可以不断的补充新的测序数据进行学习和训练,使得识别精度和识别的广度随着数据的增加而提高,提高品种鉴定的泛化性能。
技术研发人员:董川,章成君,吴小培,吴珍珍,陶华强,吴家胜
受保护的技术使用者:浙江农林大学
技术研发日:
技术公布日:2024/3/24
相关知识
一种基于杜鹃花转录组数据的ssr分子标记引物及其筛选方法与应用
基于KASP技术开发的杜鹃花核心SNP分子标记集、引物集及应用制造技术
SSR分子标记在杜鹃花属植物中的研究进展
分子标记在花卉研究中的应用进展
育种专栏
用于毛花猕猴桃雌雄性别鉴定的SSR分子标记AerM01及其应用
SSR分子标记的研究进展
分子标记技术在莲研究中的应用与进展
分子标记技术的类型及其原理
药用植物/种子品种鉴定
网址: 基于特异和多态SSR序列的多种杜鹃花品种鉴定方法 https://www.huajiangbk.com/newsview1162155.html
上一篇: 比利时杜鹃花 |
下一篇: 最名贵杜鹃花品种 最名贵最稀有的 |
推荐分享

- 1君子兰什么品种最名贵 十大名 4012
- 2世界上最名贵的10种兰花图片 3364
- 3花圈挽联怎么写? 3286
- 4迷信说家里不能放假花 家里摆 1878
- 5香山红叶什么时候红 1493
- 6花的意思,花的解释,花的拼音 1210
- 7教师节送什么花最合适 1167
- 8勿忘我花图片 1103
- 9橄榄枝的象征意义 1093
- 10洛阳的市花 1039