[Nature genetics]首次解析破译高杂合木本果树荔枝基因组——揭示群体独立驯化和杂种优势
时间:2022-01-21 阅读量:8948
引言
荔枝,一种隐于岭南山林的特色水果。
清代文学家张潮《幽梦影》中云:“笋为蔬中尤物;荔枝为果中尤物;蟹为水族中尤物;酒为饮食中尤物;月为天文中尤物;西湖为山水中尤物;词曲为文字中尤物。”
既为尤物,自然值得为之倾覆。古有苏轼“日啖荔枝三百颗,不辞长作岭南人”的赞叹;丘浚“世间珍果更无加,玉雪肌肤罩绛纱”的美誉。当然“红颜也惹得祸水”,荔枝也承受本不该属于她的笔伐:
长安回望绣成堆,
山顶千门次第开。
一骑红尘妃子笑,
无人知是荔枝来。
——杜牧
她究竟有何魅力,引得文人墨客竞相提笔?
荔枝果实主要由果皮、假种皮和种子构成,褪去果皮红装,便是白如玉雪,肤如凝脂的果肉,晶莹且清香。宋人蔡襄说荔枝“色泽鲜紫,壳薄而平,瓤厚而莹,膜如桃花红,核如丁香母,剥之凝如水精,食之消如绛雪”,并不过誉。
岭南人爱荔枝,不仅仅因为果汁清甜,果肉脆嫩,也因荔枝味甘、酸、性温,入心、脾、肝经,具有强大的食疗功效,是酷爱养生的岭南人的食疗佳品。
膜如桃花红,核如丁香母,剥之凝如水精 / Pixabay
荔枝属无患子科荔枝属物种,该属目前仅荔枝1个种。惊艳于荔枝华美之余,我们也对荔枝进行了长期的研究。野生荔枝资源极少,野生群体似乎正在走向衰落,也许不久远的将来,世间再无她的身影,荔枝家族“托举计划”的秘密在等待我们窥探。
日前,华南农业大学园艺学院主导完成了荔枝基因组的解析工作,相关成果以“Two divergent haplotypes from a highly heterozygous lychee genome suggest independent domestication events for early and late-maturing cultivars”为题发表于Nature Genetics(自然—遗传学)。XIALAB作为该工作的主要实施者之一,博士生冯筠庭(共同第一作者)完成了大部分分析任务。XIALAB的陈程杰博士(已留校)、博士生张艳青、郑家坤,硕士生李嘉威、麦迎晓也参与了该荔枝基因组数据分析工作,成为论文的共同作者。
高质量‘妃子笑’基因组组装
‘妃子笑’是荔枝广栽品种之一,其树势强,适应性广。对其进行基因组测序,共获得包括Ilumina、PacBio、HiC和10X在内的362G的测序数据。‘妃子笑’基因组杂合度2.27%,为少有的高杂合基因组。研究人员将‘妃子笑’组装到15条假染色体水平,获得高质量的‘妃子笑’荔枝基因组。
直系同源单拷贝分歧树表明,荔枝和龙眼从10 mya时从共同祖先分离。无患子科与芸香科在67.6 mya从共同祖先分离。荔枝、龙眼、文冠果和甜橙自共享γ三倍化事件后并无独立的WGD事件。
a. 荔枝果实剖面图
b. 基因组HiC互作热图
c. 基因特征圈图
d. 物种时间分歧树
e. 同源基因对的Ks值分布
图1
自γ三倍化事件后,双子叶祖先核型(AEK, ancestral eudicot karyotype)经历怎样的变化到无患子科核型?
在无患子科中检测到8处明显的AEK核型的融合事件,其中AEK6可能历经更复杂的融合断裂事件。
此外,AEK5三倍化后,三条核型都未与其他核型融合而分别演化,形成荔枝的Lc5/Lc8/Lc11、龙眼的Dl7/Dl8/Dl11和文冠果的Xs3/Xs5/Xs7情况。
图2. AEK到无患子科共同祖先的核型演化
命运背离与劫后相期
研究团队从荔枝主要分布地区收集34份野生荔枝资源和38份栽培荔枝品种。依据群体分析荔枝主要分为三大类,云南极早熟类型(EEMC/YNW)、海南晚熟类型(LMC/HNW)和早熟栽培种(EMC)。
其中云南极早熟类型又细分为云南野生(YNW)、越南野生(VNW)、广西大新野生(GXDXW)和极早熟栽培种(EEMC)。
海南晚熟类型包括海南野生(HNW)、广西博白野生(GXBBW)和晚熟栽培种(LMC)。
同样位于广西的大新野生和博白野生,它们却存在明显的遗传差异。
a. 群体SNP极大似然树
b. PCA
c. 群体历史(矫正前)
d. 群体历史(矫正后)
图3
VNW、YNW和GXDXW的近交系数明显高于HNW,LD衰退同样也表明了这一点(HNW=4.6 kb > YNW=91 kb)。YNW的低核苷酸多样性(π = 0.0042,HNW:π=0.0069,Cultivar: π= 0.0107)、较低的Fst值,以及正Tajima’s D值综合表明YNW群体经历了强烈的瓶颈选择。当然这也可能是因为YNW群体拥有更高的自花授粉亲和率。
研究人员首次开发了新方法,推断YNW和HNW亚群体共同经历了强烈的瓶颈效应后在18kya出现分离,其群体迁移方向分别为YNW/VNW/GXDXW和GXBBW/HNW。也许是命运的安排,历经劫难后的一个追寻一个等待,最终在广西相遇。
结合群体结构分析推断栽培荔枝来源于两个独立的驯化事件,LMC起源于HNW,EEMC起源于YNW,而EMC来源于LMC与EEMC的杂交。
图4. 荔枝的起源和驯化
育种工作推动差异亲本的杂交
研究人员依据亲缘关系和地缘将荔枝分为12类,YNW/VNW/DXW具有最低的同义突变核苷酸多样性(πs),表明其有效群体小,经历瓶颈选择后仍具有高的近交系数,高近交率致使群体中的有害等位基因被抑制。而HNW具有较高的πs,经历瓶颈选择后其群体得到壮大。
荔枝的育种进程是利用明显不同的亲本杂交,综合其各自优势基因,这一点尤其在最近杂交的EMC类栽培种中得到表现。育种工作者在利用杂交优势的同时通过选育优质性状清除杂种后代的有害等位基因。
a. 栽培种亲缘关系
b. 各亚分类的同义突变核苷酸多样性
c. 非同义突变核苷酸多样性/同义突变核苷酸多样性
图5
妃子笑单倍型的破译支持杂交起源
研究团队参考榕树性染色体组装(Zhang et al., 2020),提出基于SNPs的reads分型组装方法,成功获得‘妃子笑’的两个单倍型的基因组(云南单倍型,HY;海南单倍型,HH)。
HY和HH之间具有大量的SVs,CNVs和染色体的重排。野生荔枝重测序数据比对到单倍型上,YNW的80%比对到HY单倍型上,而HNW的70%比对到HH上,进一步说明FZX起源于YNW和HNW的杂交。
上:单倍型分型组装流程示意图
下:重测序到单倍型的比对率
图6
涅槃的凤凰
有了单倍型就可以对高杂合的‘妃子笑’等位基因表达进行探讨。
39个妃子笑不同组织和时期样本共鉴定到 13517个等位差异表达基因(DEA)。其中只有178个基因始终偏向表达其中一个等位基因,有大量基因在不同组织中存在差异表达。DEA在基因组上的分布并不是均匀的,在某些区域具有集中现象,可能与特定的生物学过程相关。
研究团队还发现,DEA和等位等量表达基因(EEA)具有相同的Ks值,但是DEA经受更强的选择压力。
DEA较EEA在Promoter、5’UTR、intron和3’UTR都具有更高的SNP密度,但DEA在exon上的SNP密度显著低于EEA,这表明DEA的两个等位基因有各自的功能,较不能容忍突变;而EEA的两个等位基因功能类似或相同,相互之间具有一定替代性,因此较能容忍突变。
以上结果表明,‘妃子笑’在遗传层面具有较高的杂种优势。以‘妃子笑’为代表的EMC类型,它们可能是荔枝的‘未来之星’,涅槃的火凤凰。
a. 39组织鉴定到等位差异表达基因(DEA)数量
b. DEA分布不均匀
c. DEA较EEA经受更强的选择压
d. DEA和EEA在基因特征上SNP数量差异
e. 参考基因组到单倍型的碱基突变类型和数量
图7
串联复制的VRN1基因簇处于群体选择区域
VRN1基因是拟南芥中响应春化作用的关键调控基因,它通过抑制FLC基因的表来来调控成花关键基因FT的表达。
在荔枝基因组中鉴定到LcVRN1基因簇,该簇的串联复制可追溯到无患子科的共同祖先。该VRN1基因所在的共线性区块在双子叶植物中广泛保守,但它们只在无患子植物基因组中特异地扩增,说明这些VRN1基因在双子叶植物中功能保守且重要,同时在无患子科植物可能有更广泛的功能。
荔枝中该VRN1簇含有24个串联复制基因,其在不同组织中已出现不同的表达模式,表明这些VRN1同源基因已出现新/亚功能化。
SweepFinder2 对荔枝群体变异位点进行选择分析,发现该基因簇位于正选择区域,可能与荔枝有益性状调控有关。
a. VRN1基因在无患子科物种能发生串联复制
b. 核心双子叶植物中VRN1的高保守性
c. 串联复制基因的组织表达模式不同
图8
极具育种价值的果实成熟期相关标记
依据果实成熟期进行GWAS分析,20个显著性位点的±50kb内含有109个基因,与正选基因和开花相关基因交集,最终筛选到目标基因COL307。
这是一个CONSTNAS-like基因,与拟南芥中CONSTANS(CO)最相近。CO基因是光周期调控植物开花的关键基因,这可以通过直接调控FT基因而促进植物开花。
荔枝基因组中在COL307旁边还有一个同源基因COL305,相距78kb。COL307下游含有3.7kb的缺失,进一步分析发现在EEMC/YNW中为纯合缺失,LMC/HNW中为纯合不缺失,而EMC中为杂合缺失,该缺失与果实成熟期高度连锁。基于该缺失开发的分析标记能够准确鉴定果实熟期类型,可用于荔枝辅助育种。
a. GWAS基因与其他分析的维恩图
b. 3.7kb的缺失位置
c. 缺失区域的read覆盖度存在明显不同
d. 该缺失与果实熟期显著相关
e. 分子标记准确的区分出不同熟期类型的品种
图9