首页 分享 竹学研究中的泛基因组

竹学研究中的泛基因组

来源:花匠小妙招 时间:2025-05-02 04:28

1. 引言

泛基因组(Pan-genome)现指利用高通量测序和生物信息分析手段,对不同种质材料进行较高深度测序、单独组装,以构建泛基因组图谱,最终获得该物种完整遗传信息的一种技术手段。文献调研发现,其最早出现在细菌研究中,现在在真菌、藻类、拟南芥,海洋浮游植物,农作物如大豆,林木如杨树等都有了重要进展 [1] [2] [3] [4] 。

随着越来越多的细菌基因组测序的完成,研究人员发现一些细菌株系的基因组至少有20%的DNA序列为该株系所特有,同时也不存在于同种的其他株系之中,同一细菌不同株系间存在着明显的基因差异 [5] 。直到2005年,美国基因组研究所(The Institute for Genome Research, TIGR)的科学家Herve Tettelin等人从8株B群链球菌(GBS)的独立基因组序列中,发现菌株间有1806个基因共有,而链球菌基因组有2000~2400个基因,也就是说还有一定数量的基因在某个或某些菌株内是缺失的。为了更加准确的描述细菌基因组的信息,Herve Tettelin等人首次提出了泛基因组(Pan-genome)的概念,指同种细菌不同菌株全部遗传信息的集合 [1] 。

细菌通过相应的分子机制对自身基因筛选,以适应外界环境条件,推动自身进化。许多功能基因会在利于细菌的前提下发生水平转移,同时,也为防止基因组容量的大幅增长而进行基因缺失。基因的水平转移与基因缺失是基因组进化的重要机制。缺失的基因对细菌可能是有害的、中性的、有利的,总的来说对细菌生长繁殖是非必需的 [6] 。

2. 泛基因组研究的重要成果

最新研究成果认为,泛基因组可以区分为核心基因组(Core genome)和非必须基因组(dispensable genome)2大类(图1):

核心基因组是指在同一种细菌所有菌株中都存在的基因。它是处于高选择压力下的基因,代表某一物种基本表型特征。核心基因保守性较强,有研究认为更适合作为疫苗制备的候选基因 [7] ,在疫苗设计

Figure 1. The composition of pan-genome

图1. 泛基因组构成

中具有广阔应用前景 [8] ,泛基因组的反向疫苗学(Reverse vaccinology)成果呈现 [9] 。链球菌适应性发生改变的重要机制是其核心基因组遭受到正选择,彰显其致病机制研究成果 [10] 。

非必须基因组包括部分菌株中存在的基因和菌株的特有基因(specific genome)。在细菌整个进化史上,为适应环境条件而不断发生水平转移与基因缺失,属于非必须基因。非必须基因组使不同菌株间在表型、生活方式、代谢等方面发生明显的分化,最终表现为丰富的遗传多样性。

泛基因组学研究中最重要的工作之一就是判断某一段序列在该物种基因组中的分布宽度,即这一段序列在多少菌株中存在。基于多菌株基因组的测序方法,主要通过“序列比对”来判断两个菌株甚至多个菌株序列之间的同源关系,包括直系同源基因鉴定、基因组同源比对。

2.1. 生物

细菌菌株鉴定多采用的MLST (Multilocus sequence typing)方法,选用多个基因的策略来进行分析,存在很大的局限性。泛基因组的分析方法可从选择所有单拷贝的核心基因用于演化分析,或基于基因得失的进化事件,计算不同菌株之间非核心基因比例以及差异,作为演化分析矩阵。泛基因组在分类与鉴定中,方法更为灵敏 [11] 。

在植物界,2011年,见德国科学家对来自8个区域的80株拟南芥Arabidopsis thaliana进行测序,研究了拟南芥泛基因组中小的核酸多态性、大片段的插入和删除,并对基因功能、变异特征进行局部、全局的关联分析 [12] 。

Emiliania huxleyi是一种海洋浮游植物,科研人员对来自互相隔离的不同地区的14个植株进行了基因组测序并对其进行了序列比对。采用泛基因组分析表明,其基因组由核心基因和不同种系存在变异基因组成,使得其适应广泛的气候环境,从赤道到北极的全球范围内都有广泛分布 [13] 。

中国农科院与北京诺禾致源生物信息科技有限公司等机构,2014年,率先报道了野生大豆(Glycine soja)的泛基因组研究成果,对7个从头组装(De novo assembly)的野生大豆基因组进行比较,发现共有59,080个基因家族,其中48.6%为核心基因,51.4%为非必需基因。发现与野生大豆生物逆境相关的R(抗病)基因类型远高于栽培大豆。此外,还发现一系列重要的开花基因(如PHYA, FT和LEAFY等)、与脂肪含量相关的三酰甘油(TAG)合成、蔓生性及器官大小(产量相关)等相关候选基因在野生大豆和栽培大豆之间发生了重要的遗传变异,为大豆品质育种、光周期、产量等相关基础研究与应用提供了依据 [3] 。有资料显示,诺禾致源还与国际热带农业研究中心(CIAT)进行着木薯(Manihot esculenta)泛基因组研究。等等。

在林木中,2016年最新首现杨树泛基因组研究成果。首次关注了杨树泛基因组的结构与功能,研究人员对3个杂交杨树品种基因组的结构变异(structural variation, SV)、插入缺失(InDels)、拷贝数(copy number variation, CNV)进行了全基因组研究,杂交变异后的基因种类丰富,主要与其抗性相关 [14] 。

此外,基于人类基因组中存在着种群特异、甚至个体独有的DNA序列和功能基因,中国科学家在2009年率先提出了“人类泛基因组”的概念,着手研究人类基因序列的总和,成果不断涌现。

2.2. 方法学

泛基因组的研究分析工具不断完善。中科院北京基因所基于Perl语言开发了一套泛基因组自动化分析工具PGAP (Pan-Genomes Analysis Pipeline),基于蛋白编码基因数据对多株细菌进行泛基因组自动化分析,包括功能基因聚类、泛基因组特征、功能基因遗传变异、物种演化、基因簇功能富集等,用户可以通过一条命令完成这些工作 [15] 。2016年,荷兰瓦格宁根大学生物信息学组Siavash Sheikhizadeh等人,开发了一种泛基因组工具(PanTools),适用于高等真核生物,其由代表泛基因组的De Bruijn图和在线构建泛基因组的计算法则两部分组成,可用于泛基因组注释、序列添加、基因分类、基因序列或基因组区域检索、基因组重建、泛基因组的比较与查询等,用来综合表征多种注释的基因组,便于分析基因组成分的组成与结构 [16] 。

3. 泛基因组在竹学中的运用

竹子多是多年生一次性开花的独特植物,其笋期快速生长,常见于热带、亚热带地区,但北可至萨哈林群岛,在喜马拉雅可分布到雪线(4200 m)。因为竹子的形态性状复杂多变,常缺少花、果实等繁殖器官的关键性状,竹子不但对竹族、亚族的划分存在巨大分歧,而且属的界定存在很大争议。虽然以李德铢研究团队为代表的队伍等在经典分类基础上,卓越运用叶绿体、核基因和简化基因组、转录组、生命条形码等数据,创新竹类系统发育研究领域,取得了优异成果,但竹子仍然因为杂交、渐渗、非协同进化、拷贝数变异、基因水平转移、化石证据不足等原因,导致得到的基因树冲突 [17] - [24] 。采用泛基因组的研究思路和方法,是解决竹类系统发育与演化科学难题的途径之一。

簕竹属–牡竹属–巨竹属是一个内部系统发育极其复杂的复合群,已有研究揭示其为杂交起源类群 [25] 的复杂关系,建议进一步采用泛基因组手段,仔细探求之。

2013年,毛竹(Phyllostachys edulis)全基因组草图的公布,阐明:在数万年前,毛竹从禾本科中分化形成,在进化的过程中出现过染色体加倍成为四倍体,继续进化成现在的二倍体植物 [26] 。毛竹原产中国,24˚N~32˚N间生长着世界上绝对数量的资源,其垂直分布从海拔几米到1000 m左右,个别地区可达1400 m左右的高度,甚至达到1600 m [27] (图2)。毛竹先后引种至日本、韩国、菲律宾、越南及欧美各国。在日本,1736年从中国长沙引进的毛竹,已经长到了北海道,直线距离超过2800 km (图3) [28] 。从表型看,毛竹已经发表了22个种下类型 [29] 。如此广袤分布的毛竹,虽然呈现强单克隆优势 [28] ,但也表现了良好的地理适应性,和早竹 [30] [31] 、桂竹 [32] 、麻竹 [33] 、慈竹 [34] 等一样,初步发现其具有多元的遗传格局。众所周知,龙头竹(Bambusa vulgaris)是世界分布面积最广大的竹子,世称“泛热带竹种”;神农箭竹(Fargesia murielae)已经栽进了北极圈……从泛基因组的角度,分析这些竹类的强适应性、抗逆性机制,同样具有重要的科学、产业和生态意义。

厚壁毛竹(Phyllostachys edulis “Pachyloen”)自发现以来,因其竹壁特厚,具有重要经济性状,已从生物学、解剖学、繁育学、引种学、生理生化、种质资源学、材料学、分子生物学、多种组学等不同视角,进行了系列研究 [35] - [43] 。同样,野外调查发现,胸径可达30cm以上,秆高30多米高的巨龙竹(Dendrocalamus sinicus)也有“厚壁”、“薄壁”类型 [44] [45] 。此外,箭竹类(Fargesia spp.)、泰竹类(Thyrsostachys spp.)多有厚壁性状。竹子也有竹壁极薄的种类,如泡竹(Pseudostachyum polymorphum)、薄竹(Cephalostachyum chinense)、沙罗单竹(Schizostachyum funghomii),多种竹(Schizostachyum spp.)等等,泛基因组可以探索竹子具“中空结构”的竹壁的形成机制。其它诸如花秆、花叶、花斑、条纹等众多的特异资源,具有泛基因组研究的着力点。

Figure 2. Suitable distribution of Phyllostachys edulis

图2. 毛竹适宜区分布图

Figure 3. Distribution of P. edulis from China to Japan and its repro- ductive traits. Notes: (a) 1736 Year, Bamboo from Japan; (b) Asexual re- production; (c) Sexual reproduction

图3. 毛竹从中国到日本的分布及其繁殖特征。注:(a):1736年,毛竹引进日本;(b):无性繁殖;(c):有性繁殖

基金项目

科技部科技支撑项目2013BAD01B06-3。

NOTES

*通讯作者。

相关知识

竹学研究中的泛基因组 Pan
Nature:黄三文团队两项研究探索泛基因组赋能育种
泛基因组:赋能未来作物育种的基石
MP长篇综述|植物泛基因组及其应用
遗传:细菌、真菌和动植物的泛基因组研究进展
稻属最全超级泛基因组图谱问世
JGG | 西北农林科技大学植物免疫研究团队构建小麦条锈菌泛基因组
Nature Plants | 通过泛基因组揭示向日葵基因的遗传多样性
首个玉蜀黍属超级泛基因组助力玉米遗传改良
专家点评 Nature Genetics | 北京大学现代农业研究院构建西瓜属端粒到端粒超级泛基因组

网址: 竹学研究中的泛基因组 https://www.huajiangbk.com/newsview1828608.html

所属分类:花卉
上一篇: 竹亚科簕竹属毛凤凰竹繁殖器官的补
下一篇: BAMBUSOIDEAE Nee

推荐分享