ontology

2020-011 RNA velocity of single

2022-01-14  本文已影响0人  SSSimonYang

RNA velocity of single cells

文献阅读篇 1

RNA丰度是单个细胞状态的有力指标。单细胞RNA测序可以显示RNA丰度,这种方法定量准确性高,灵敏度高,通度高。但是,这种方法只能在某个时间点捕获静态快照,这对分析时间层级的现象(例如胚胎发生或组织再生)提出了挑战。

在这里,我们提出,可以通过区分常见单细胞RNA测序方案中Unspliced mRNAs和Spliced mRNAs来直接估计RNA velocity(基因表达状态的时间导数)。

RNA velocity是一个高维向量,可以在几小时的时间尺度上预测单个细胞的未来状态。 我们在神经脊谱系中验证其准确性,展示其在多个已公开数据集和技术平台上的应用,揭示发育中小鼠海马的分支谱系树,并检查人类胚胎脑中的转录动力学。 我们期望RNA velocity能够极大地帮助分析发育谱系和细胞动力学,尤其是在人类中。

Fig.1

image-20200814202745395

该图展示了单细胞测序数据中能够检测到部分Unspliced reads。覆盖到内含子区域的reads即为Unspliced reads。红色为占比。

image-20200814205901434

该图提出了用于推断RNA velocity的重要公式。在某时刻,以α速率产生u个Unspliced mRNA,以β速率对Unspliced mRNA进行剪切,以γ速率对Spliced mRNA进行降解。取β = 1,也就是所有速率的测量都以β作为基准。

image-20200814203739655

该图展示了u(Unspliced mRNA数目),s(Spliced mRNA数目)跟随α进行变化的示意图,符合常理。

image-20200814204105792

该图反应了两种趋势。1. 当u > γs时,ds/dt大于0,s越来越大,直到u = γs。2. 当u < γs时,ds/dt小于0,s越来越小,直到u = γs。直觉上讲,当u很大时,必然需要提高剪切速率,产生s,最终相等。而当u较少时,剪切产生的s不如降解的多,必然会导致s的减少,最终相等。因此,每个基因在瞬时都有u = γs的趋势。

image-20200814204846888

该图反映了,基因的u与下一时间点基因的s模式相似。

image-20200814205115863

左图为Fgf1基因,右图为Cbs基因。能够看出基因表达随时间的变化确实对
u = γs有趋向性。

image-20200814205429412

该图的箭头表示了基因的表达从观察状态到t时刻的预测状态的趋向性。因为预测是对每个基因实现的,因此通过PCA降维对数据进行展示。从图中可以看出,箭头的指向性与真实t时刻后的基因表达较为类似。

Fig.2

image-20200814205954680

该图为小鼠雪旺细胞前体分化成嗜铬细胞的PCA降维分类图。

image-20200814210217740

该图为Serpine2基因(表达下调), Chga基因的(表达上调)。从图中可以看出,Serpine2基因在分化前的细胞中u > γs,随后u逐渐减少,最终消失。positive residuals表明预期上调, negative residuals表明预期下调。

image-20200814210727592

RNA velocity以箭头进行标注,大致展示了时间层级的信息。

image-20200814211308257

在本例中通过概率计算选择最合适的计算时间,2.1h。

image-20200814211526688

在tSNE中使用近邻细胞进行池化操作估计的RNA velocity。

Fig.3

image-20200814211830403

小鼠海马细胞tSNE作图,b中中间图表明基因表达预期上调还是下调(positive还是negative),右图表明Spliced mRNA数量。

image-20200814212733342

tSNE与RNA velocity的结合。右上角展示了通过马尔科夫过程导致的稠密区域,代表了分化终点。

该图展示了RNA velocity在没有先验发育过程知识下确定系谱树方向的能力。

image-20200814213522684

从红色点细胞到达相邻细胞的单步概率可视化。

该图展示了细胞命运决定的过程,细胞命运的选择很可能是一个不确定的过程,基因表达倾向于一个或另一个命运,然而一旦转录因子反馈循环建立就变成了一个锁定的最终命运。

Fig.4

image-20200814213846164

人类谷氨酸能神经元分化图。

image-20200814214200019

伪时间表达谱。不论是上调还是下调,Unspliced mRNAs始终先于Spliced mRNAs。同时,能够发现RNASEH2B基因的转录动力学很快。而DCXELAVL4STMN2等基因显示了快速的转录爆发,随后持续的转录水平降低,Spliced mRNAs明显呈延迟轨迹。

结论

这一方法有望为我们理解细胞基因表达在分化过程中的动态提供更坚实的定量基础。

上一篇下一篇

猜你喜欢

热点阅读