【文献分享】拟南芥种子到种子发育单细胞核转录组
今天分享1篇拟南芥单细胞的文章,从种子到种子构建全生育期的单细胞图谱。
与大多数动物类似,植物经历了动态的胚胎后器官生成,以在整个生命周期内形成新的器官。一些植物器官高度专门化且发育阶段特定,而许多器官由具有不同亚功能的不同细胞类型组成。然而,一些细胞类型根据解剖和生理特征在不同器官和发育阶段之间共享功能。例如,在许多组织中,表皮细胞类型通常被定义为器官最外层的一部分细胞,它们保护器官并与外部环境刺激互动。相比之下,内部定位的维管细胞则需要输送水分和营养物质。
同样的,同一种分类的细胞之间的转录组在各种组织中的相似性程度以及任何组织特异的转录标志的程度仍然是一个待解开的问题。
还是先看文章的实验设计。
文章的取样,几乎横跨拟南芥的整个生命周期,10个发育时间点上收集的组织。蛀牙包括:种子和萌发的种子(0天和1.25天),三个幼苗发育阶段(3天、6天和12天),发育中和完全展开的转座子(21天和30天),茎(40天),包括基部、顶部和分枝区域,花组织,和角果(下图A)。
通过两种不同的过滤标准(严格和松散),分别获得了801,276(下图B)和432,919(下图C)个细胞的全生育期图谱,每个数据集相关的细胞数量和表达的基因数目如上图E和F所示。然后作者发现在中间区域有一个很大的cluster(下图D)(定义为central cluster【当然我也不明白为啥要highlight这个central cluster,感觉注释大概率上就是叶肉细胞先关的细胞类型】),GO分析也表明这个central cluster与光合作用相关。
这篇文章的分析思路,没有对整个图谱做过多的细胞类型注释等方面的阐述【我也不明白为啥】。反而接下来分析了每个样本单独的图谱,尝试从单个图谱去看拟南芥发育过程中的细胞多样性,如下图A就是每个样品聚类和注释的结果。在图B又highlight了slique的结果,以及slique的marker基因(图C和D)【可能要与最后空间转录组的结果前后呼应吧】。
接着,作者思路又转到了seedling的几个样本【作者给出的理由是seedling包含大多数的细胞类型,也能理解,毕竟是整株。但是逻辑我不太理解,转的很突兀】。作者把seedling的3个样品进行了整合(下图A)。然后把根毛的单独拿出来做了轨迹分析(下图B),下图C是已知根毛轨迹基因的表达情况。然后作者对比了seedling的不同生育期,相关的细胞在伪时间轨迹上的分布,发现随着seedling的生育期,有些根毛细胞有一个随着生育期才出现的pattern(下图D)。然后作者挖掘了根毛发细胞在伪时间上差异表达的170个基因,并在热图中展示(下图E【这个图是真心不好看,色系选的一言难尽】),从热图可以发现对应于(I)早期、(II)中间和(III)晚期伪时间的三个主要基因类别。然后把这三类基因在(F)全局、(G)整合幼苗和(H)根毛中的表达pattern。
接着作者利用这个图谱,开始探索同一细胞类型在不同组织之间的差异,这也很容易理解【毕竟常规操作】,最终结果highlight的是phloem(韧皮部)和guard cell(气孔)(下图A)。把人疲敝和guard cell的细胞拉出来重新进行了聚类(下图B和C),然后查看了韧皮部和保卫细胞系谱簇中每个数据集的细胞分布(下图D)。 但是下面的分析我就没懂了,比较了韧皮部和保卫细胞cluster之间共有的和特异的marker基因,并用upset图来表示(下图E和F)【比较这两个细胞类型,还是完全不一样的细胞类型,不确定意义在那里。刚开始我以为是比较了相同细胞类型不同组织之间的共有和特异marker,但是看upset图好像又不对】。然后highlight了共享组织标记(CYP709B1 [AT2G46960])和独特标记(ANAC029 [AT1G69490])在气孔系谱的亚簇内的表达,全球整合数据集,以及每个组织数据集内的表达。
下面,作者开始重点关注转录因子,探索不同的转录因子在细胞类型和不同的组织器官中的表达模式。首先TF之间做了个相关性分析,聚了各类(图A),可以看出有些TF module还是具有细胞和器官的特异性的。然后作者又计算了转录因子表达的平均排名,较高的值表示在某个组织器官中具有更广泛和显著的表达(下图B),例如角果特异的转录因子AT3G15510(ANAC056)和AT3G62340(WRKY68)的表达(下图C和图D)。在下图E中,作者又highlight了保卫细胞特异表达的转录因子的表达(下图E)。然后更进一步的,作者尝试查看每个转录因子家族是否在不同的cluster之间/细胞类型之间有一定的特异选择。作者采取的方法是用每个转录因子尝试去对cluster做降维PCA分析(下图F-I),可以看出有些家族可以明显的分开不同的细胞类型。然后作者特地挑了MYB和bZIP家族进行详细的阐述。
最后作者又做了一个slique的空间转录组,和单细胞数据进行了对比。下图A就是对1.25天龄萌发种子的空间转录组学数据进行降维和聚类结果。可以看出不同的细胞类型基本对应空间位置上种子的不同地方(下图B),作者重点关注与胚胎幼苗(下图C)和种子外皮(下图D)相对应的cluster。作者利用空间数据,可以鉴定出一些新的子组织的标记基因,例如胚叶相对应的空间簇标记基因(CP29A [AT3G53460])(下图E)。
然后作者利用MERFISH的方法观察多个转录本在单细胞level的表达,下图F就是在角果中用MERFISH标记的全部140个转录本的可视化结果(下图F)。有些emboryo和endosperm的marker基因可以看出很清晰的在对应的位置表达,例如预测的胚胎(AT3G20150)和胚乳髓质(AT2G44240)的新标记基因(下图G和H)。下图I中则是鉴定的保卫细胞标记基因的空间映射。(J)在角果数据集(左)和全局数据集(右)中显示了两个新的保卫细胞系谱标记基因的表达【哎,但是这2个基因好像都是已知的保卫细胞的标记基因】。