上海京生电器有限公司

上海京生电器有限公司

上海京生电器有限公司生产制造包塑软管,包塑金属软管,不锈钢软管,不锈钢包塑软管,尼龙塑料波纹管
详细企业介绍
? 上海京生电器有限公司是一家包塑金属软管生产型企业,而我们更加关注的是客人的采购体验与价值创新;我们是制造商,但我们更加重视零售市场,尊重每一位客人的切实需求。我们不一味追求大的规模,我们更注重客人在需求方面的细节关切
  • 行业:塑料建材
  • 地址:上海市闸北区普善路280号3号厂房
  • 电话:021-63525587
  • 传真:021-63500047
  • 联系人:何静
公告
我们生产制造的产品具体包括:热镀锌包塑金属软管,内包塑软管,平包塑软管,内外包塑软管,不锈钢穿线软管,不锈钢包塑软管,尼龙软管,塑料波纹管,金属软管接头,塑料软管接头,电缆防水接头,防水接线盒,明装盒等。
聚宝盆心氺论坛奖结果

课程论文翻译

  发布于 2022-05-28   阅读()  

  在进化生物学中,理解为何一些进化谱系产生了异常高的物种多样性是一个重要的目标。非洲维多利亚湖地区的Haplochrominis族慈鲷包含了在过去的15万年中形成的超过700个物种。这个维多利亚湖地区的“超群”如何在如此短的时间尺度上迅速进化是一个存在已久的问题。在此,我们证明了两个分歧的谱系之间的杂交通过提供遗传突变促进了这一过程,这些遗传突变在杂交后被重组、分选到许多新物种中。值得注意的是,杂交事件在已知涉及适应和物种形成的视蛋白基因上产生了异常的等位基因突变。更普遍的情况是,与父母谱系确定不同的突变会突出新物种间的分化,这种现象在出现适应辐射现象的新物种组合中出现。我们得出的结论是:在与生态机会一致的情况下,分歧谱系之间的杂交可能促进快速、发散的适应辐射。

  谱系中突变速率的异质性是形成生物多样性的重要因素。然而,这种异质性背后的生物和环境因素尚未被完全了解1。适应辐射的特征是表现出生态适应多样性的物种快速形成事件,因此成为了研究这些因素的主要研究对象。适应辐射需要在生态和生殖隔离相关的性状中产生高度的遗传突变。然而,连续的物种形成过程间需要不断出现新的相关突变,适应辐射对于这来说通常太快了,因此适应辐射更有可能由已产生的突变产生2。种间杂交可以即刻加快遗传突变,从而加速物种形成和适应辐射3,4,5,6,7,8,9。

  在适应辐射的成员之间的杂交已经被认为可能有助于物种形成,这个观点被称为“杂婚假说”3。性状的基因渗入参与适应或生殖隔离的现象已经在几个适应辐射案例的成员中被证实了(例如,实蝇科Rhagoletis属果蝇与宿主变化相关的性状10;Heliconius属蝴蝶的翅膀图案11,12、达尔文雀的喙形13)。在其他适应辐射的案例中,一些物种推测存在杂交的祖先,但基因渗入性状和物种形成之间的直接联系还有待进一步的验证(例如坦葛尼喀湖14,15,16、马拉维湖17、维多利亚湖18,19、巴隆比波湖20的慈鲷)。

  另一个假说与杂婚假说截然不同,认为杂交在适应辐射现象中起着更基础的作用,不同谱系之间的杂交可能导致整个适应辐射现象的发生3。在不同谱系间发生二次接触,且在新环境的定居期间针对杂种的选择较弱时,这样的杂交可能是常见的4。在这种情况下,杂种群的形成可以通过如下方式来加速适应辐射:(1)提供可以重组为自然选择和配偶选择有利的新性状组合的有功能的遗传突变(2)破坏限制亲本谱系进化的遗传相关性3。除此以外,当引起两个亲本物种的生殖隔离的多个稳定的差异解耦并分离成杂种群时,杂交可能会加速物种形成,这时,针对不相容的基因组合的选择可以产生多于2个生殖隔离的物种21,22,23。

  显然,这个“适应辐射的杂种群起源”假说更加难以验证。到目前为止,唯一被粗略验证过拥有杂种群起源的适应辐射现象是夏威夷银剑菊,它是从两个北美麻迪菊物种的异源多倍体杂种种群适应辐射而来的24。因为基因和基因组的重复也被认为会促进适应辐射的发生25,所以在这些案例中,很难将中间杂交和基因、基因组的重复带来的影响区分开来。目前,已经在阿尔卑斯白鲑26、马拉维湖的慈鲷科“mbuna”群的适应辐射27、异源多倍体的夏威夷本土唇形科植物28,29和其他夏威夷的多倍体植物30的案例中发现了与适应辐射的杂种群起源相吻合的证据。然而,在这些系统中,杂交事件是否晚于或早于适应辐射起始的时间点,以及杂交驱动的多态性是否在物种形成和适应多样化中起到影响,还有待验证。

  维多利亚湖地区的慈鲷“超群”(Lake Victoria Region Superflock of cichlid fish,下称LVRS)是一个包含超过700种Haplochromine族慈鲷的群体,这些慈鲷是维多利亚湖以及周边约10-20万年前分化出的湖泊系统中的本土物种31,32,33,34。这个“超群”包含了数个适应辐射群体,每个群体位于所在区域的主湖中(维多利亚湖、爱德华湖、阿尔伯特湖、基伍湖)。主湖中最大的是维多利亚湖,它拥有至少500个在过去15000年中进化出来的本土物种34,35,36。每个适应辐射群体在栖息地占领、营养生态、颜色和行为上有着惊人的多样性。尽管LVRS非常年轻,但是它们拥有高水平的分化速率和核基因组突变34,37,这证明大量的稳定突变在适应辐射事件开始时就已经出现2,3。先前的研究发现在重建系统发育树时,LVRS与几个河流慈鲷物种出现了细胞核不协调性。这说明在古代可能存在两个已发生分歧的物种之间的杂交事件,但是目前无从考证37。已分歧物种二次接触时的杂交并非不可能事件,因为不同地区的在数百万年前就已分开的慈鲷可以在实验室条件下很容易地产生可育后代38。

  通过使用取样自各个非洲主要河流系统的Haplochromine族慈鲷和来自维多利亚湖地区的所有慈鲷谱系的代表物种的基因组数据,我们在此证明了维多利亚湖地区的慈鲷物种是由一个杂种群进化而来的。每个湖泊中的辐射适应群体都显现出非常相似的混合的祖先的比例,这些混合的祖先源于两个远缘相关的Haplochromine族谱系,这两个谱系在不同的河流系统中独立进化了超过一百万年。我们发现的证据表明,这种杂交事件通过提供已被重组和分选到许多新物种中的遗传突变促进随后的适应辐射事件。来自亲本家系的稳定突变在较年轻的维多利亚湖慈鲷之间出现了明显分化,但在不同物种中出现了许多突变的新组合。值得注意的是,涉及维多利亚湖丽鱼科鱼类适应和物种形成的视蛋白基因的两个主要等位基因39,40可能来自两个亲本家系中的一个。这表明该基因在LVRS中的突变的主要部分来源于这些谱系之间的杂交。我们的研究结果表明,与生态机会相一致的相对较远相关物种之间的杂交可以促进快速适应性辐射。因此,即使发生在遥远的过去,杂交也可能对理解谱系之间现存物种丰富度的变化以及近期多样化速率的变化具有重要意义。

  为了识别LVRS的最近亲缘关系,我们对来自LVRS和来自Haplochromine族慈鲷栖息的主要河流系统的的Haplochromine族慈鲷进行了全面采样(图1,补充数据1)。我们基于3.15Mb的RAD-seq测序结果(436,166个SNP,8.1%缺失数据,补充数据2)和两个线bp)重建了最大可能性系统发育树。在基于核的系统发育分析中,整个LVRS形成了一个具有强有力支持的分支,该分支还并包含了来自埃及尼罗河下游的物种(Haplochromis spp.Egypt)和来自鲁济济河(流出基伍湖流入坦噶尼喀湖)的物种(Haplochromis sp.Nyangara),(图1,补充图1,补充讨论中的橙色标签)。来自卡兰博河(刚果河流入坦葛尼喀湖的支流)的斯塔普氏妊丽鱼(Astatotilapia stappersi,标记为Haplochromis sp.Chipwa)和来自刚果中部的一种未被记载的的妊丽鱼属物种(A. sp.Yaekama ,刚果民主共和国)共同构成了LVRS“超群”的近亲,以下统称为“刚果系”(Congolese lineage,红色标签)。 LVRS的姊妹类群加上刚果系分类群是一个分支,包括来自东非大裂谷封闭河流系统的谱系和来自维多利亚湖地区东部的印度洋河流系统的谱系(“Eastern taxa”,东部分类群,深蓝色)以及来自基伍湖的“Haplochromis” gracilior和来自爱德华湖的Thoracochromis pharyngalis(淡蓝色,补充讨论)。尽管后两个物种与LVRS成员是同域的,但它们显然不是这个适应辐射群本身的一部分。我们将H. gracilior和T. pharyngalis称为“尼罗河上游系”,因为其所有已知的成员的分布都局限于历史上称为尼罗河上游流域的地区37,42。与先前的文献资料一致的是33,43,我们估计这一谱系约160-580万年前从刚果系分裂出来,与东非大裂谷西支的侧翼隆起截断古河网络并将LVR(新尼罗河上游)与刚果河(补充表1;补充图3)隔离开来的时间点相吻合。

  我们的全基因组核取样为LVRS适应辐射群内部的关系提供了一个全新的的解释(图1,补充图1)。 来自维多利亚湖(包括其主要支流卡格拉河),萨卡火山口湖和其连通的姆潘加河,以及阿尔伯特湖的适应辐射群体都形成了单系分支。 相反,LVRS的爱德华湖群包含了维多利亚湖和萨卡湖的适应辐射群体,以及与基伍湖共同组成分支的其他分类群。 这些发现与假设一致34,即爱德华湖构成了LVRS内现存最古老的适应辐射群体,从其中衍生出其他湖泊的辐射,且爱德华湖和基伍湖之间的连通事件最近才发生。

  基于串联序列数据的系统发育重建假定整个基因组的形成历史是单一的,尽管基因重组、不完全支系演化和渐渗杂交可能在谱系中引发大量基因组水平的突变44。为了解释这种谱系突变,我们重建了基于SNP的物种树45。由此产生的树支持LVRS与刚果分类群的姐妹关系,但揭示了LVRS与东部分支和尼罗河上游分支之间的不一致性(补充图2)。为了研究基因混合情况,我们计算了Pattersons D统计量(ABBA-BABA检验)46。我们发现,所有的LVRS适应辐射群都显示出与尼罗河上游系的两个物种(H. gracilior和T. pharyngalis)基因混合的强烈信号(图2,补充表2,补充图4)。 LVRS和其他物种之间的超额等位基因共享(excess allele sharing)强度相同(补充表3,第2.1-2.4行,补充图5)。值得注意的是,无论是H. gracilior还是T. pharyngalis,它们与同一区域的的LVRS物种基因混合的程度并不高于和来自其他地理上分离了数千年的湖泊的LVRS物种基因混合的程度(图2和补充图5)。

  (b)检验每个东部分类群和尼罗河上游分类群之前潜在基因流的D statistics。正的D值表示P1和P3之间的基因流,负的D值表示P2和P3之间的基因流,如图(c)中所注。确切的值和更多测试结果在Supplementary Table 2.中给出。

  为了研究基因流动的方向,我们使用了Partition D statistic的扩展版本进行分析47(5种群测试,补充表3)。我们发现了证据证明来自H. gracilior(图2b中的g)和T. pharyngalis(图2b中t)的基因流流向每个湖泊的LVRS适应辐射群体,但没有证据表明反向的基因流的存在(补充表3,行1.1-1.4)。我们进行了F4-ratio检验,估计得所有LVRS适应辐射群体的上尼罗系血统比例约为20%(补充图6和补充表4)。对维多利亚湖和基伍湖的适应辐射群体的物种以及A. stappersi,T. pharyngalis和H. gracilior的全基因组测序证实了LVRS成员与尼罗河上游系之间的超额等位基因共享,并揭示了约3kb大小的始祖区(ancestry block)。这与基因混合发生在数千代以前的不同湖泊中所有“超群”适应辐射群体的共同祖先上这一证据相吻合(图3a,补充图8)。基因混合体的全基因组标签与维多利亚湖和基伍湖不同物种相关(图3b),这与LVRS形成伊始的共同基因混合事件相吻合。

  (a)推定的始祖区的长度分布显示大多数始祖区均较小,刚果系(红)的始祖区略大于尼罗河上游系(蓝)。图表显示了五个LVRS适应辐射群体不同大小类别的始祖区的数量统计。因为大多数区块不能跨越多个3kb的框,许多区块也无法明确地指定给刚果或者尼罗血统(灰色),始祖区的平均长度很可能是3kb甚至更小,与数千年前的杂交事件相吻合。

  (b)全基因组测序的LVRS成员的始祖区间的相关性总体来说很高,但随着它们之间遗传距离的增加而降低。这个箱线图显示了fd在同种的不同个体、姐妹种、亲缘关系更远的维多利亚湖物种、基伍湖物种、基伍湖和维多利亚湖物种间的相关性。这表明所有的适应辐射群体成员在历史上共同拥有同一次杂交事件,但遗留下来的相同成分随着事件的推移而逐渐分化。这也表明一部分杂交产生的突变仍然在单独的物种中发生分化(由fd在同种的不同个体中的相关性的偏离所揭露)。

  许多已知有助于生态适应和生殖隔离的表型在LVRS的各个适应辐射群体的多个物种形成事件中发生了分化(例如,牙齿形状、雄性繁殖期的体色、视蛋白基因)。这些表型中的一部分在刚果系的妊丽鱼属和尼罗河上游系的Thoracochromis属物种间也存在差异。在拥有类似分化方式的妊丽鱼属物种的杂交实验中发现了内在的不相容性38。此外,湖中适应辐射群体的一些等位基因突变已经显示出早于LVRS的起源(参考文献49,50),也许最值得注意的是长波敏感的(long-wavelength sensitive,LWS)视蛋白基因,维多利亚湖慈鲷被研究的最透彻的基因之一51。该基因编码视网膜锥体中对红色敏感的视色素的蛋白部分,在维多利亚湖地区的慈鲷中异常多样化51。它对于适应维多利亚湖地区的湖泊特有的与水深和浊度梯度相关的急剧变化的环境光梯度方面有着至关重要的作用。由于水中的颗粒物吸收、散射波长较短的光线,水体中的光谱相对更加红移,因此更多的红移LWS视蛋白突变体在深水和浑浊水中是有益的39,52。这种视蛋白基因也可能在行为生殖隔离中起作用,因为具有不同LWS视蛋白基因型的物种之间的色觉差异通常与不同的雄性繁殖期体色相关39,49,54,而这恰好是重要的配偶选择线。

  51。在慈鲷LWS基因的第177位氨基酸上的取代将单倍型I类的吸收峰相对于单倍型Ⅱ类红移了7nm49,51,其它位置上的替代也影响光谱敏感度(补充讨论,补充数据3)。这两个单倍型类通常与不同的光环境有关,I类是浅水和清水,II类是深水和浊水。例如在岩质湖岸刮食藻类的Neochromis和Mbipia属,和在湖底取食碎屑的Enterochromis属,可能代表了维多利亚湖适应辐射群体的早期分歧事件,它占据了维多利亚湖光谱中相对的两端:清澈的浅层和昏暗的深层。先前从Neochromis和Mbipia属鱼类测序的全部438个LWS单倍型是单倍型I类的一部分39,49,而12个Enterochromis属鱼类的LWS单倍型中的11个属于单倍型II类(参考文献39)。在生态类型不同的谱系中,占据浅水和深水,或占据清澈水域和浑浊水域的姐妹物种往往在这两种LWS单倍型类或它们之间的重组型中具有不同的频率,并且LWS突变始终与雄性繁殖期体色的分化相关联(图4,补充讨论)。我们对刚果系和尼罗河上游系分类群中的LWS视蛋白基因进行了测序,发现LVRS中的两个单倍型类别每个仅与这两个亲本谱系中的一个谱系共有51(图4,补充图7,补充数据3,补充讨论)。所有来自刚果系的个体的单倍型在I类分支中占据基础位置,而尼罗河上游系的单倍型在II类分支中占据基础位置。

  LWS视蛋白基因单倍型类,I 和 II,在LVRS(橙)中单独地与刚果系(A. stappersi and A. sp. ‘Yaekama’, 红色)或尼罗河上游系(H. gracilior and T. pharyngalis, 蓝色)共有(详见Supplementary Fig. 7Supplementary Data 3)LWS单倍型类 I 通常和生活在浅而清澈的水域中的慈鲷相关,而LWS单倍型类 II 通常和人生活在更深、更浑浊的水域中的慈鲷相关。不管是在适应辐射的早期还是晚期,通过生境类型分化进行的物种形成似乎都是通过固定可变的LWS单倍型基因完成。例如生活在浅水刮食藻类的Neochromis和Mbipia属对生活在泥底取食碎屑的Enterochromis属。另一个处于分化早期的物种也证明了这一点:主要携带单倍型I的Pondamilia macrocephala蓝色(生活在浅水)和主要携带单倍型II的等位基因的Pondamilia macrocephala“黄色”(生活在更深的水域)

  为了验证是否可以在基因组的其他位置检测到类似的杂交突变的分布模式,我们检验了LVRS物种中高度分化的基因组SNP是否大部分来自于两个亲本谱系的杂交后代。我们推测出了六个表型不同的维多利亚湖物种的双等位SNP的起源,这六个物种分别是食虫的嗜虫朴丽鱼(Pundamilia pundamilia),食虫/食浮游动物的奈里朴丽鱼(Pundamilia nyererei),刮食藻类的杂食朴丽鱼(Neochromis omnicaeruleus),以其他物种的幼体为食的Lipochromis melanopterus,食虫的Paralabidochromis chilotes和食鱼的Harpagochromis cf. serranus(图5)。我们发现维多利亚湖物种有30%的SNP位点发生了异常强烈的分化(LV 异常区),其中的一个等位基因(图5a中3、4类)很可能经由尼罗河上游系的基因渗入引入到该适应辐射群体的祖先中。刚果系和尼罗河系中固定为备选等位基因的位点(图5a中的第4类)在LV异常区非常丰富,并显示出与维多利亚湖慈鲷的祖先突变体镶嵌状的分化相一致的模式(图5b)。第4类SNP在LV异常区的极大丰富似乎并不是由于这些位点有着在这些区域天然有着更高固定可能性,因为在与六种来自于该适应辐射群体之外的控制组慈鲷的两两比较中,LV异常区在对照组中并没有比其他区域固定更多的第4类SNP(补充表5,补充讨论)。我们的全基因组测序数据也支持这样镶嵌状的血统组成模式(补充图8)。

  a)在刚果系(C)和尼罗河上游系(N)分类群中的固定可变等位基因的位点含有大量高FST的SNPs。在六个维多利亚湖物种(如(b)所示)的12890个等位基因SNP中,340个是高FST(LV一场区)的异常值。根据刚果(C)和尼罗河上游系(N)类群中两个等位基因存在或不存在,我们将SNP分配到五种不同的谱系中。灰色条显示每个血统类别中所有SNP中LV异常值的比例。顶部显示每个类别的总SNP计数和双侧Fisher精确测试的P值。祖先类别(1)包括所有在刚果和上尼罗河分类群中一起发现两个LV等位基因中的一个的新SNP(新的LV等位基因或未亲本谱系中的未取样),(2)在刚果类群中发现的两个LV等位基因(3)在刚果人中只发现一个等位基因,但是在上尼罗河分类群中发现的两个等位基因(在没有杂交的LVRS中不可用),以及4)刚果和上尼罗河分类群中的每一个都固定为替代的LV等位基因(在没有杂交的LVRS中不可用)可能包括Bateson-Dobzhansky-Muller不兼容性。类别5包括维多利亚湖初始等位基因频率相似的站点(16%),比父母血统(类别4)中替代等位基因固定的站点,以测试第4类的富集是否仅仅是因为初始等位基因频率较高。(

  b)在刚果系和尼罗河上游系(LV物种平均全球FST = 0.52)固定为替代等位基因的LV异常值之间,维多利亚湖慈鲷品种之间的亲本等位基因的差异分类。每个正方形表示根据该物种的等位基因频率进行着色的SNP,从红色(固定为刚果系等位基因)到蓝色(固定为尼罗河上游系等位基因)。除了两个位点(右边的2 + 3)之外,所有的都位于Pundamilia nyererei参考基因组的不同支架上。 22条染色体中的至少10个参与了在祖先杂种群的亲本谱系中固定用于替代等位基因的辐射物种之间的镶嵌样的等位基因分配模式。

  在这里,我们证明了多个大型动物适应辐射群体起源于杂种群体。我们的研究结果表明,在整个维多利亚湖地区慈鲷科鱼类“超群”形成伊始,发生了两个haplochromine族慈鲷谱系之间的杂交事件,一个谱系来自刚果河上游,另一个谱系来自尼罗河上游(图1,补充图1)。鉴于(1)目前的证据高度支持整个LVRS是一个单系(2)每个湖中的适应辐射群体拥有相似的来自尼罗河上游系和刚果系的血统比例(补充图6)(3)刚果系和尼罗河上游系的(始祖区)高度相关(图3),因此现代或略早一些的尼罗河上游系到各个湖的适应辐射群体的基因渗入不太可能发生。此外,无论是H. gracilior(基伍湖)还是T. pharyngalis(爱德华湖),他们和共同生活的LVRS物种的基因混合程度并不比和其他湖中的LVRS物种的基因混合程度高(图2和补充图5),这个事实也不支持近代发生的基因渗入事件。阿尔伯特湖,萨卡湖和维多利亚湖的适应辐射群体于100,000年前(维多利亚湖)至4,000年前(萨卡湖)在地理上与爱德华湖和基伍湖相隔离,同时也就与T. pharyngalis和H. gracilior这两个物种隔开

  LVRS物种与H. gracilior和T. pharyngalis(补充表3,第2.1-2.4行,补充图3)之间共有的等位基因数量非常相似,表明与LVRS的刚果系祖先杂交的分类群与尼罗河上游系物种或其祖先的亲缘关系非常近。刚果系很可能在一个较为湿润的时期(例如,14.5万年至12万年前,补充图3)通过汇入维多利亚湖的马拉加拉西(刚果河)支流在维多利亚湖定居,然后遇到了在那时已经占领了维多利亚湖地区的尼罗河上游系慈鲷的代表物种。当时维多利亚湖地区大型湖泊的存在很可能为多样化提供了生态机会,这种机会可以被基因多样性化的杂种群体所利用。

  39,51。杂种群体中的祖先单倍型内部的重组进一步扩充了可被LVRS适应辐射所利用的LWS单倍型的有功能突变(补充讨论,补充数据3)。这个基因对于适应维多利亚湖水域水体中的光谱红移尤其重要39,51。把刚果系和尼罗河上游系的视蛋白单倍型集中在一起似乎有助于适应极端范围内的的光线条件和视觉生态。在适应辐射的早期和后期阶段,这两个视蛋白单倍型间发生了多次转换。生态分化(Enterochromis对Neochromis / Mbipia)和在较年轻的姐妹物种之间的主要栖息地变化与刚果系-尼罗河上游系来源的单倍型对LWS基因座的补充有关(补充讨论)。

  38,56和性状的新颖程度57也会增加。在物种形成中这两种变异都是重要的。在先前所述的实验中,刚果系和尼罗河上游系分类群的分歧时间较晚,这使我们预测这两个谱系之间的杂种群将包含内在不相容性和激进的表型突变。与此预测相一致的是,我们发现含有两个亲本谱系中固定的备选等位基因的基因组位点富富含可能参与维多利亚湖中的分歧适应和物种分化的异常位点(图5)。这表明物种形成通常与通过杂交事件在适应辐射群体的祖先中聚集在一起的等位基因的分选有关。显示出负上位相互作用(Bateson Dobzhansky Muller(BDM)不相容性)的位点将被固定在亲代谱系中的备选等位基因,因此归入图5a的祖先类别4中。在这一类别中,LV异常区的大量增加符合杂种群体中出现的物种间BDM不相容性的分化21,22,23,这可能促进了适应辐射群体成员之间的生殖隔离。鉴于刚果-尼罗始祖区模式之间的相关性随着LVRS内物种间系统发育距离的增加而降低(图3b),很可能刚果系和尼罗河上游系的等位基因在LVRS中已经分开了很长时间,并且在物种分化的过程中,这些等位基因在适应辐射群体成员中逐渐被分配。

  来自LWS视蛋白基因和祖先变异的全基因组排列模式的证据与祖先杂交对于维多利亚湖慈鲷“超群”的进化的重要作用是一致的。由此产生的大量遗传变异可能有助于解释在维多利亚湖地区共形成700个物种,包括维多利亚湖特有的在过去大约15,000年内进化出来的500多种遗传和表型高度分化的物种,的多个适应辐射群体如何在短短10-20万年内形成

  31,32,。因此,我们的数据为假说3提供了证据,即当与新形成的湖泊的新生态机会(例如在新形成的湖泊定居)一致时,异种谱系之间的杂交可以通过自然选择和性选择来重组、分选杂交衍生的多态性,进而促进快速的适应辐射事件的发生。

  24中得到了粗略的证明。在这里,我们报告了一个强有力的证据,表明杂交的祖先推动了多种动物的大型适应辐射群体的分化。感谢高通量测序的出现,这使我们验证古代杂交事件和研究其对后续进化的影响的能力大幅增强。未来的研究将揭示主要适应辐射群体的始祖杂交事件是否广泛存在,以及它的发生是否可以解释一些观察到的不同谱系中物种多样化的速率和数量的巨大差异。

  为了鉴定维多利亚湖区域慈鲷“超群”(LVRS)的最近亲缘关系和潜在的杂交事件,我们对与维多利亚湖地区连通,或曾经连通过的的所有主要河流系统中的Haplochromine族慈鲷和LVRS所有主要适应辐射群体的代表物种进行了RAD测序。根据这些数据和相同鱼类的线粒体序列利用最大似然法构建系统发育树,进而推断最近亲缘关系。 使用D statistics,5种群检验和F4-ratio test鉴定谱系之间的杂交,分别确定基因流的方向和量化血统比例。然后,对鉴定为LVRS的祖先谱系的鱼类和LVRS的代表物种,进行全基因组测序以证实杂交的特征并估计始祖区大小。

  我们从维多利亚湖地区的所有主要湖泊和几个小湖泊,以及流出Rwenzori山脉的Mpanga河(补充数据1,图1)中捕捞Haplochromines族慈鲷。此外,我们收集或从其他收藏家获得属于所有系统发生谱系的haplochromines和从几乎所有非洲河流系统的haplochromines。我们还收集了其他非洲大湖的Haplochromines种群成员,包括马拉维湖,坦噶尼喀湖和Mweru湖(图1,补充数据1)。样本是在坦桑尼亚渔业研究所和坦桑尼亚农业,畜牧和渔业部;乌干达国家渔业资源研究所和乌干达农业,畜牧业和渔业部,以及赞比亚渔业部研究和样本出口许可下收集的。所有样本均按照适用的国际和国家动物使用准则和道德标准进行收集。

  58。限制性位点相关DNA测序(RADseq)按照标准方案进行59。使用限制性核酸内切酶HF-SbfI(NewEngland Biolabs)过夜(8-10小时)酶切,每个样品400-1000ng DNA。 P1衔接子含有5-8bp长的条形码,与所有其他条形码至少有两个核苷酸不同。用Covaris S220 Focused-Ultra超声波仪对DNA进行剪切,从琼脂糖凝胶中提取300-600bp长的片段。我们进行了18个PCR循环来扩增RAD片段(30 s 98°C,×18(10 s 98°C,30 s 65°C,30 s 72°C),5 min 72°C)。所有的文库在Illumina HiSeq 2,500测序仪上进行单端测序。读取被解复用并用Stacks管线中的process_radtags脚本修剪成84个核苷酸(nt,条形码去除之后),纠正条形码中的单个错误并丢弃具有不完全限制性位点的读取。由于阅读结束时质量下降,84 nt的长度是由于去除条形码(大部分是6 nt长)和最后10 nt的修剪而造成的。 FastX工具包()用于删除所有包含至少碱基的Phred质量分数低于10的基因,并读取超过10%的分值小于30的碱基。

  61)将每个个体的读数映射到Pundamilia nyererei参考基因组,使用端对端比对选项。使用GATK Unified Genotyper v.3.1(参考文献62)调用单核苷酸多态性(SNP)和基因型。然后所有的站点都用自定义的Python脚本和vcftools v.4.1(参考文献63)进行过滤。插入和缺失5nt以内的SNP被删除,以避免由于匹配错误导致的错误SNP,并且要求SNP的分值至少为30。

  65, 使用Sanger测序或者从GenBank下载与RADseq数据集(补充数据1)相同的物种序列,序列在BioEdit 7.2.5(参考文献66)中的ClustalW中进行比对,并手动调整以获得正确的局部对准。

  使用最大似然方法(RAxML v.7.7.7和ExaML v.1.0.4)67,68分别重构线粒体基因和级联RAD序列的系统发育,包括变体和不变位点。对于线粒体数据集,使用三个分区重建最大似然树,一个用于Dloop,一个用于ND2的第一和第二密码子位置,另一个用于ND2的第三密码子位置。对于每个数据集,我们使用速率异质性的GTRGAMMA模型对100个快速启动进行RAxML分析。对于RAD-seq数据集,我们使用不超过40个个体(25%)的连接点重建具有RAxML(参考文献

  67)和ExaML(参考文献68)的最大似然树。通过从连接的数据集中随机采样替换位点来获得100个自举的每一个,以获得原始大小的数据集。然后按照RAxML-light手册中的建议,使用速率异质性的GTRGAMMA模型,用ExaML(参考文献68)为每个重采样数据集推断最大似然树。我们使用RAxML基于这100个拓扑计算了引导支持值(参考文献67)。核和线粒体的树木与尼罗罗非鱼(Oreochromis niloticus)的参考基因组一起生根,并使用R软件包Ape v.3.1(参考文献69)进行分化和绘图。

  45)。 SNAPP绕过基因树,通过整合所有可能的基因树,直接从独立遗传标记计算物种树45。我们将这个分析限制在每个物种的两个个体中(一个用于A. sp。Yaekama),并且SNAPP假定位点之间没有连锁,我们只包括彼此间距至少500kb的双等位点。结果数据集包含31个人和1,817个地点。我们运行SNAPP进行了1,000,000次迭代,使用默认的先验对每1000次迭代进行采样。我们丢弃了前50%的树,并将其余500棵树的后部分布看作Densitree70中的共识树。

  46,72(ABBA-BABA测试),一种基于四分类树中不一致SNP谱系的频率检测杂种的方法,其中软件包ADMIXTOOLS v 1.1(参考文献48)。如果基因型的阅读少于6次或基因型质量Phred评分20(即错误概率 1%),则丢弃基因型。 D统计学的重要性用一个分块刀切割程序进行评估,以三个标准差的z分数作为阈值48。我们使用了三个来自Kinneret湖的Astatotilapia flavijosephi作为外群种群,并且我们测试了来自每个东部和上游尼罗河分支进入LVRS的基因流相对于与LVRS最近亲属共享的等位基因的证据,刚果排水分类群A.来自赞比亚的stappersi(图2)或A. sp。来自刚果中部的Yaekama。对于这些分析,我们使用了至少50%的位点在至少10个阅读深度测序的所有个体。为了排除D统计偏差的可能性,读数与维多利亚湖物种Pundamilia nyererei相匹配,我们也将读数与Astatotilapia burtoni参考基因组(这是D统计中使用的所有分类群的外群)进行比对。为了排除外群(A. flavijosephi)的选择偏离了D统计量,我们用A.burtoni或A.desfontainii作为外群重复测试。附表2给出了所有具有个体数和个体数的组合。

  为了推断LVRS和Nilotic分类群之间基因流的方向性,我们使用了由Eaton&Ree47开发的分区D统计量检验的扩展版本(我们称之为“5人口检验”)。类似于D统计,这个测试是基于不一致的等位基因共享模式,但是通过考虑五个种群,它允许推断基因流动的方向性。具有拓扑((P1,P2),(P3a,P3b)),O的五个分类群包括基因流的潜在来源(例如P3a),接受基因流的分类群(例如P1),近亲(例如P3b和P2)和外群(O,另见附表3)。如果基因已经从例如P3a渗入到P1中,则渐渗供体(P3a)的近亲(P3b)也将显示与P1共享的过量等位基因,但比P3a的程度要小。这是因为从P3a渗入P1的许多衍生等位基因将由P3a和P3b共享,因为它们最近的共同祖先。相比之下,我们不希望基因流接收者P1的近亲(P2)会显示与P3a和P3b共享的过多的等位基因。在基因组数据中,这将被看作是过量的BABBA模式,其中P1与P3a和P3b共享衍生的等位基因(B),而P2具有外群等位基因(A),与数量的ABBBA模式(P2分享派生等位基因与两个P3分类)。另一方面,如果基因流的方向是从P1到P3a,则P3b不会显示与P1共享的过量等位基因,相反,P2会显示与P3a共享的过量等位基因,因为P1和P2之间祖先共有的等位基因渗入P3a 。因此,从P1到P3a的基因流不会影响BABBA和ABBBA模式的相对频率,但是BBBAA(P1,P2和P3a共享一个派生的等位基因)的频率比BBABA更频繁(P1和P2共享一个派生的等位基因P3b,见补充表3)。计数不一致的等位基因共享模式,从而使我们能够推断基因流的方向。

  我们用一个定制的脚本计算了五个人口测试,使用每个LVRS组的最少缺失数据的三个个体以及所有其他分类群体中具有最完整数据的单个个体。与基于等位基因频率的ADMIXTOOLS计算的D统计量相比,我们的五个人口测试是根据伊顿和Ree47对每个重点人群的单个个体计算的。我们分别对每个LVRS组的三个个体进行测试,并报告每个辐射的手段。在杂合位点,随机选择一个等位基因。对于每个测试个体的组合,我们计算了使用所有站点计算四个D统计量(补充表3)所需的八个模式,没有缺失数据。我们以s.d为单位计算z分数。从伊顿和Ree47中的100个自举数据集(重新采样替换的站点)。

  为了推断LVRS和Nilotic分类群之间基因流的方向性,我们使用了由Eaton&Ree47开发的分区D统计量检验的扩展版本(我们称之为“5种群检验”)。类似于D statistic,这个测试是基于不一致的等位基因共享模式,但是通过考虑五个种群,它允许推断基因流动的方向性。具有拓扑((P1,P2),(P3a,P3b)),O的五个分类群包括基因流的潜在来源(例如P3a),接受基因流的分类群(例如P1),近亲(例如P3b和P2)和外群(O,另见附表3)。如果基因已经从例如P3a渗入到P1中,则渐渗供体(P3a)的近亲(P3b)也将显示与P1共享的过量等位基因,但比P3a的程度要小。这是因为从P3a渗入P1的许多衍生等位基因将由P3a和P3b共享,因为它们最近的共同祖先。相比之下,我们不希望基因流接收者P1的近亲(P2)会显示与P3a和P3b共享的过多的等位基因。在基因组数据中,这将被看作是过量的BABBA模式,其中P1与P3a和P3b共享衍生的等位基因(B),而P2具有外群等位基因(A),与数量的ABBBA模式(P2分享派生等位基因与两个P3分类)。另一方面,如果基因流的方向是从P1到P3a,则P3b不会显示与P1共享的过量等位基因,相反,P2会显示与P3a共享的过量等位基因,因为P1和P2之间祖先共有的等位基因渗入P3a 。因此,从P1到P3a的基因流不会影响BABBA和ABBBA模式的相对频率,但是BBBAA(P1,P2和P3a共享一个派生的等位基因)的频率比BBABA更频繁(P1和P2共享一个派生的等位基因P3b,见补充表3)。计数不一致的等位基因共享模式,从而使我们能够推断基因流的方向。

  我们用一个定制的脚本计算了五个人口测试,使用每个LVRS组的最少缺失数据的三个个体以及所有其他分类群体中具有最完整数据的单个个体。与基于等位基因频率的ADMIXTOOLS计算的D统计量相比,我们的五个人口测试是根据伊顿和Ree47对每个重点人群的单个个体计算的。我们分别对每个LVRS组的三个个体进行测试,并报告每个辐射的手段。在杂合位点,随机选择一个等位基因。对于每个测试个体的组合,我们计算了使用所有站点计算四个D统计量(补充表3)所需的八个模式,没有缺失数据。我们以s.d为单位计算z分数。从伊顿和Ree47中的100个自举数据集(重新采样替换的站点)。

  为了证实我们从RAD序列数据中发现的结果以及对祖先块体大小的分析,我们对来自维多利亚湖的九条鱼的全基因组进行了测序,其中两条来自基伍湖,以及我们发现的最接近现存的谱系代表类群直接在LVRS,刚果的Astatotilapia stappersi,和上尼罗胸喉咽和“Haplochromis”gracilior的祖先。全基因组测序数据使用无PCR的文库制备76和Illumina HiSeq 3000配对末端测序法产生11个个体。另外三个人在同一台机器上以相同的方式进行测序,这些人是从McGee et al.77获取的(参见补充数据1了解样本信息)。用Bowtie 2进行局部与Astatotilapia burtoni参考基因组50的比对(参考文献61)。对于不同的调用和基因分型,我们使用单倍型呼叫者(GATK v.3.5)62。使用vcftools v。4.1(参考文献63),删除少于5个阅读,多等位基因和indels的基因型。

  为了研究基因组中外加剂的特征,我们使用了Martin等人的fd统计。与D统计相比,fd更适合小基因组区域78。使用等位基因频率计算ABBA和BABA模式计数,按照ABBA或BABA模式拟合每个分离位点46,72,78。作为一个例子,如果一个站点分别在P1,P2,P3和outgroup中得到0,0.5,1和0的等位基因频率,则它将被计为一半的ABBA站点。我们用A. stappersi作为P1,不同的LVRS个体作为P2,H. gracilior和T. pharyngalis作为P3和A. burtoni作为外群(补充图8)。请注意,与D统计相比,P1和P2被切换,其中LVRS用作P1,刚果谱系用作P2。这种差异仅仅是为了与Martin等人78对fd的描述一致,因此这里ABBA代表LVRS和上尼罗河之间共有衍生等位基因的位点,而BABA代表具有刚果和上尼罗河血统之间共享的衍生等位基因的位点类群。 fd计算为ABBA和BABA模式之间的差异,相比于P2和P3之间的基因流量等于随机交配的最大可能差异78。正值fd值表示P2(LVRS)和P3(上尼罗河)之间的基因流。我们使用Martin等人的Python脚本,在A. burtoni脚手架的非重叠滑动窗口中计算fd。排除少于五个ABBA和BABA模式的Windows。由于只有阳性fd值表明上尼罗河和LVRS之间过度的等位基因共享,并且被正确地标准化,所以具有负D分值的值被设置为0,如Martin等人。用统计R-package计算Pearson的不同个体之间fd值的产品时刻相关性。

  通过比较ABBA位点(LVRS分享衍生的等位基因完全与上尼罗河分类单元)的频率和BBAA位点的频率(LVRS仅与刚果血统代表A.stappersi分享派生的等位基因)的频率,评估了推定的刚果人或上尼罗河血统非重叠滑动窗口3 kb。具有100kb数据的支架被移除。至于fd统计,利用等位基因频率计算ABBA和BBAA模式计数,按照其适合于ABBA或BBAA模式的权重对每个分离位点进行加权。只使用总ABBA和BBAA模式计数超过1的窗口。将最小ABBA比例((ABBA /(ABBA + BBAA))为0.7的窗口定义为上尼罗河血统祖先的候选窗口,并以蓝色着色,而ABBA比例为0.3或更小的基因组区域被定义为推定的刚果祖先的小块被定义为相同颜色(红色或蓝色)的连续滑动窗口,忽略没有数据的单个滑动窗口,用Racimo等人的公式计算出预期的祖先块大小。混合后约5万〜10万代,重组率为2.5×10〜(-8),上尼罗河比例为20%,混合料的预期平均长度为(0.8×2.5×10-8×(5万〜10万) 1)) - 1 = 500bp至1kb(参考文献79)。祖先块体的分裂可能已经减缓,因为原始杂交种群开始经历基因组稳定,在独立的湖泊中形成地理上孤立的辐射,每个湖泊彼此独立地进一步稳定化,可能与祖先变异的差异分选相关。