孤雌生殖的普鲁士鲤鱼同源/异源多倍体基因组的平衡进化

2022-11-01  本文已影响0人  吕强强学生信

浏览到今年在NC上发表的一篇针对孤雌生殖的六倍体普鲁士鲤鱼的基因组文章,作者组装到了单体型水平,前段时间也看到了国内学者对孤雌的银鲫的文章,发在了nature另一子刊上了,这两篇文章都需要好好学习一下,先看一下NC这篇,时间原因,整理了下大致意思,方便自己以后回忆文章内容,翻译不通的地方以后再完善了。

一.背景:

普鲁士鲤鱼(Prussian carp),又叫银鲫,原产于亚洲,在欧洲是入侵物种。它是金鱼的近亲,并与濒危的本地鲫鱼争夺同一栖息地。然而,金鱼和本地鲫鱼通常都是有性繁殖,而普鲁士鲤鱼有一个主要的进化优势:孤雌生殖。但是,雌性普鲁士鲤鱼却占用了雄性鲫鱼或其他鲤鱼的精子,然后再丢弃它们。被劫持的精子刺激普鲁士鲤鱼的卵细胞分裂。然后雄性的遗传物质在卵细胞中被分解而不被利用。这被称为依赖精子的孤雌生殖,或处女生殖。所有通过这种方式产生的后代都是普鲁士鲤鱼雌性的克隆体。因此,大多数普鲁士鲤鱼种群都是雌性,雄性很少出现。

普鲁士鲤鱼是六倍体,有六组染色体。多倍体物种研究中通常会关注的有一些主要问题,比如基因数目增加的分子变化、性别决定机制、减数分裂和生理的影响以及与二倍体同体的相互作用。尤其是三倍体减数分裂过程,通常需要其它无性繁殖方式产生后代。

为了更好的理解其单性繁殖背后的机制,奥地利蒙德塞因斯布鲁克大学湖沼学研究部的Dunja Lamatsch对普鲁士鲤鱼的基因组进行了测序组装。

二.结果:

Genome sequencing, chromosome assembly and annotation

通过PacBio平台对一六倍体银鲫进行测序,数据量约为每一单倍型的~45-fold coverage,平均长度为19kb(sup Data1a)。对同一个体进行Hi-C测序,~97-fold coverage , reads 对数为1,639,548,159。通过hifiasm组装PacBiao的HiFireads到haplotigs,然后将Hi-C数据比对到haplotigs上辅助组装到scaffold水平,scaffold的N50达到了30.7MB,Contig的N50达到了4.3Mb。通过手动调整或得了普鲁士鲤鱼六倍体的染色体所对应的150条长scaffolds序列。总体上,93%的,5.07Gb组装序列能够标记到染色体上。

蛋白编码基因组注释,采用了同源物种预测、RNA-seq和从头预测策略,注释到152,308个蛋白编码基因(Sup Data2)。150,182(98.6%)能够blast到Swissprot/Refseq数据库,130,496(85.7%)比对到Pfam数据库。In total, 9015(5.9%) 个基因为单外显子基因。此外或得了16,571个tRNA,348 rRNA, 1495 miRNA,和9258个其它的ncRNA(Sup Data3a)。18,131(12%)个假基因被预测到。经过注释后,基于Actinopterygii_odb9,BUSCO评估完整性从94.7提到到99.2%。

普鲁士鲤鱼基因组含有41.3%的重复序列(Sup Data3b), 基因组中分布35.1%的大量的重复元件,其中5.9%为未知。丰度最高的转座元件为Helitrons(3.19%),L2(2.85%)和hAT-Ac(2.54%)元件。

Haplotype-resolved structure of the hexaploid genome

为了理解基因组遗传特征和多倍化过程,和两种进行双性生殖的四倍体金鱼、四倍体鲤鱼,三种二倍体鲤鱼进行全基因组的基因组比较分析,确定了25组共线性、同源染色体区段。

系统发育树计算每组共线性区段(Fig2a)发现普鲁士鲤鱼的基因组结构由三组单倍型(a-c,Fig.2b)组成, 每一组由两种haplotype组成,这两种来自异源四倍体的鲤鱼和金鱼鲤类基因组染色体,命名为A和B(即AaAbBaBb)。这总共产生了两个类似于A和B的三倍体,即6个单倍型(AaAbAcBaBbBc),每个单倍型有25条染色体。在染色体构建的系统发育树中,6个单倍型中的Ac、Bc和其它两个单倍型分离,并与C. Auratus关系更密切(图2)。

Fig.2 亚基因组结构系统发育树

a. 采用ML方法,对C.gibelio六倍体基因组中6*25的haplotype中每一个都在全基因组范围内(coding和non-coding 序列)的构建系统发育树。其haplotypes (CarGib_Aa, _Ab,_Ac, _Ba, _Bb, _Bc) 与祖先二倍体鲤类草鱼(CteIde)、二倍体鲤类Onychostoma macrolepis (OnyMac)、异体四倍体普通鲤鱼,Cyprinus carpio (CypCarA/B)、Carassius auratus (CarAur A/B)和二倍体斑马鱼(DanRer)的染色体序列进行比较。亚基因组A和B分支长度有一些轻微的差异。Aa和 Ab和CypCar_A和CarAur_A聚类到一起, Ba 和 Bb 和 CypCar_B 和CarAur_B聚类到一起。

b. 六倍体 Prussian carp (C. gibelio) 基因组亚基因组结构分析。

普鲁士鲤鱼有两个亚基因组A和B,每个亚基因组分为三个单倍型a,b,c。AaAb和BaBb代表两个二倍体祖先物种染色体组成,通过杂交产生了四倍体Carassius 和 Cyprinus 谱系的共同祖先(AaAbBaBb),普鲁士鲤染色体加倍多了两个染色体组(AcBc),因此包含150 (= 6 × 25)条染色体。蓝色或者绿色(a,b)和红色(c) 线条分别代表同源等位基因和部分同源等位基因。

为了阐明同源多倍体或异源多倍体的三个亚基因组(即单倍型a、b、c)的起源,研究人员采用了一种策略,该策略已成功地用于异源多倍体非洲爪蟾(Xenopus laevis)基因组和同源多倍体小体鲟基因组。其推理基础为:异源多倍体中,基因组中快速进化的移动元件的重复和遗迹为异源多倍体祖先所有,因此会聚集在系统发生树的单独分支中。对于同源倍体染色体组,重复元件不能区分同源体。在金鱼基因组中,基于20种类型的TEs,确认鲤鱼特异性全基因组复制(Cs4R)为异源多倍体,而这些TEs,几乎只富集在一个亚基因组中。使用这20种TEs和通过SBI分析确定的其它5种TEs,在普鲁士鲤基因组中发现,富集到亚基因组A或者B中的TEs和鲤系四倍体祖先 (Cs4R)一致(Fig. 3 and SupFig. 2)。然而,a、b和c三个单倍型在TE密度上没有显著差异,表明其同源多倍体起源。

Fig3.六倍体普鲁士鲤染色体上转座元件DNA-X-8_DR、hAT-N91_DR、TC1DR2和Mariner-12_DR的密度,呈A、B亚基因组偏置分布。TEs密度以染色体长度归一化(Mbp)的频数 (num)计算。

采用Subgenome-biased index,SBI,方法揭示普鲁士鲤是异源多倍体还是同源多倍体。TE的SBI值从0到1,当值接近1时,说明TE在a、b、c中的一条染色体上差异富集。这种TEs可用于从同源染色体中区分等位基因,并用于区分六倍体普鲁士鲤的最近发生的异源或同源染色体加倍事件。然而,从这个分析中没有明显的这种TEs (Fig4b和SupFig3),因此没有证据支持单倍型a、b和c是异源多倍体。

Phylogenomics and divergence time estimates

为了确定普鲁士鲤在鲤亚科种中的遗传位置并估计其分化时间,筛选所有物种和普鲁士鲤亚基因组A和B上的直系同源基因集,并计算基因组的同义替换率(Ks),SupData6。普鲁士鲤和金鱼亲源性最近,这两种谱系在100万~200万年前分化,异体四倍体Carassius谱系祖先的A和B基因组的祖先分化时间要长得多,大约在15-28 Mya年前,四倍化事件估计在8.3至18 Mya年之间(Fig. 5)。

Subgenome dominance and rediploidization

六倍体异育银鲫的基因组进化包括两个不同的阶段:一是来自异源四倍体鲤族祖先的古代亚基因组A和B的进化,二和AcBc 的同源染色体加倍。

在这个异源多倍体谱系(这里是A和B亚基因组)去多倍体化的过程中,一些基因副本可能会随机丢失,可能发生在两个亚基因组上,也可能优先发生在一个亚基因组上。普鲁士鲤B亚基因组上蛋白质编码基因的总数(BaBbBc = 77204)略高于A亚基因组(AaAbAc = 75104)( SupData2)。这种基因含量的差异可以用B组3号和22号染色体长度更长来解释(SupFig5)。

根据进化分支长度,进化更快的A亚基因组BUSCO基因缺失率为12.8-13.4%,而B亚基因组缺失率仅为7.8-8.2%。然后研究人员对亚基因组A和B上在BUSCO中missing的基因集进行数目和功能富集分析,发现A基因组中缺失的基因会在B基因组中保留,反之亦然。Missing基因假定在普鲁士鲤自多倍体化后缺失,24个基因中,3个基因(kansl3, mapk15, ighmbp2)在GO term中和“染色体组织”有关,一个基因(sra1)和有丝分裂细胞周期的调节有关。推测到缺失的基因数量如此之少,可能是由于普鲁士鲤鱼出现的时间很短的原因。研究人员的结果与近期发生多倍化的植物选择作用于DNA修复/管理/减数分裂基因的结果一致。

microRNAs和其它ncRNAs频数在6个单倍型所有的染色体上没有显示出在哪个染色体上存在偏倚(Supplementary Fig. 6),而tRNA和rRNA基因在一些染色体上数量存在明显偏倚。

在异源多倍体基因组中,亚基因组的优势相对于复制丢失而言,会发生来自亲本亚基因组之一的基因的过表达,因此,研究人员将RNA-seq reads比对到每个单倍体基因组上,比较了亚基因组上的转录活性 (Fig. 6)。B亚基因组的基因表达有增加的趋势(它也丢失了较少的BUSCO基因),但A亚基因组的4号和22号染色体基因在性腺中表达较高。在少数情况下,单倍型a、b或c中的一条染色体有表达偏倚,例如,眼睛中的24Bb染色体或肝脏中的22Ba和22Bc染色体。

Fig6. 150条染色体上来自不同器官的RNA-seq reads的计数,左到右依次为亚基因组和单倍型AaAbAcBaBbBc

三.材料方法

Expression analyses

使用HISAT将来自脑组织、眼、性腺、肝和肌肉RNA-seq reads 比对到基因组

使用SAMTool统计比对到各个染色体上reads,比对到基因上使用featureCounts统计,每基因每百万转录组本通过StringTie计算。条形图和热图使用R的geom_bar in library ggplot包和heatmap.2 in gplots包。

Haplotype resolved hexaploid genome assembly

使用Hifiasm组装 Pacbio HiFi reads,然后将HiFi reads通过Minimap2重新比对到“p_utg”和“p_ctg”上检测uniform coverage,通过Bedtools genomecov (v2.25.0)计算每个碱基的coverage。“p_ctg”多峰分布说明一些组装区域为塌缩区。“p_utg”上coverage分布最均匀且只有一个峰值,可认为是完全解析的单倍型。Omni-C reads通过juicer比对到haplotigs,然后通过自己的脚本和3d-DNA、Juicebox等软件进行辅助组装。

Phylogenetic trees of whole chromosomes and identity assignment

六倍体Carassius gibelio基因组通过minimap2与鲤科基因组: diploid Onychostoma macrolepis (GCA_012432095.167), diploid Ctenopharyngodon idella (GCA_019924925.1), allotetraploid Cyprinus carpio (GCF_018340385.130), and allotetraploid Carassius auratus (GCA_014332655.112)比对。染色体共线性及配对比对通过Last aligner (v941),1-to-1 matches通过 Lastsplit过滤。

总结:

该文章基因组单体型基因组组装前半部分、亚基因组分析部分需要我去学习,尤其是Subgenome bias index的概念。

本文使用 文章同步助手 同步

上一篇下一篇

猜你喜欢

热点阅读