单细胞测序文章解析scRNA

单细胞好文1--Tracing tumorigenesis in

2020-03-24  本文已影响0人  冻春卷

前言

我在2019年3月份写过一篇这样的文章(一文读懂scRNA-Seq)到底要花多久时间才能看懂一套单细胞测序数据结果?,并在文末许诺,对PPT感兴趣的小伙伴可以留言询要PPT。没想到后来有陆陆续续超过几十个人留下了邮箱,这时候发现事情大条了。那篇文章是我第一次认真看的单细胞文章,可以说是什么都不懂,因此看了有超过十个小时,看的时候还查专业词汇和背景知识,可见那一文必然非常青涩。时常觉得自己对不起这几十个读者的信任,非常担心自己并没有提供什么好的学习经验,因此早早打定主意说要重新写一篇,让大家看到单细胞的文章其实也并非那么简单,体会到单细胞的美。

这里仍然会按照之前提到的看文献方法:老板亲自传授的文献阅读方法来准备这篇文献解读。废话不多说,开始吧。

选文

原文链接:https://doi.org/10.1038/s41467-020-14777-0
image.png

文章标题囊括了三个热点:tracing tumorigenesis,tumor model,single-cell resolution

1. tumorigenesis:肿瘤发生是一个非常细微且难以察觉的事件,其具体进程如下图所示。肿瘤的发生非常难以检测,并且缺少临床样本。因此,tracing tumorigenesis 还有许多未知且绝对是肿瘤学的热点之一。

Resveratrol nanoformulation for cancer prevention and therapy

2. tumor model:肿瘤的研究离不开好的模型。目前我们知道的肿瘤研究模型有:肿瘤细胞系,原代细胞系,CDX,PDX,基因工程小鼠,包括最近大火的organoid等等。这些研究模型各有利弊,PDX和基因工程小鼠,其中某些基因工程小鼠的表现十分优异,例如邓初夏教授培育的:Brca1 flox/flox ; MMTV-Cre mice (带有Brca1 exon11的缺失,可自发形成乳腺癌)。那么这篇文章其实是基于作者团队的前期研究结果来进行的,他们在前期的时候构建了 K14-cre-β-catGOF Bmpr1aLOF mice (gain of function of β-catenin; loss of function of Bmpr1a ),这种小鼠可以自发发生特异性的 salivary gland head and neck squamous cell carcinomas (SCCs),即唾液腺头颈部鳞癌。拥有这样的肿瘤模型小鼠,他们在自己的领域上就没有人可以跟上了。

3. single-cell resolution:无需多做解释

再次提一下我看文的思路:

image.png

1. Background and gap

常规套路:(1)某某癌症是非常严重的疾病;(2)某某基因、蛋白在这个癌症中起很大的作用,But,它在某个过程中的作用尚未明确;(3)某某过程是在肿瘤发生中非常关键,But,我们目前对它还知之甚少。。。。。。

本文提到:肿瘤发生过程是对肿瘤治疗研究的非常重要的一步,但是目前我们对肿瘤发生这个起点知道的太少了。虽然patient samples可提供巨量的信息,But,由于肿瘤样本的异质性以及疾病的复杂性,样本常常是混杂的多期肿瘤细胞,并已丢失tumorigenesis阶段的信息,因此,合理的tumor model和对照十分重要。正好作者的前期研究发现:某基因、信号通路对salivary gland SSCs的发生起非常重要的作用,并创建了相应的肿瘤模型,因此打算来个高精度的研究,探一探这肿瘤发生的究竟

image.png

2. Aims, Novelty/Significance

3. Hypothesis

hypothesis高度浓缩了预期的结果,要求不仅仅看摘要,还要了解introduction。Introduction是文章中非常宝贵的一段,这是作者思路的集中体现,同时我们也可以通过认真阅读来快速了解作者这一领域的大致情况。这比自己疯狂找十篇文章来看要高效得多。当然有时候别人引用文献只是提及其中小小一点,不能代替被引文献的全貌,因此只能说是大致了解用,真正要了解还得下苦功。

Hypothesis:

hypothesis.png

4. Major approaches

重要的实验设计、材料、方法非常重要,不然无法理解文章结果从何而来,这边我一般是先一扫而过method,然后再结合结果来看那些我无法理解的实验结果。

文中method:

1. Mouse strains:介绍小鼠的基本情况,以及杂交培育设计,略。
2. Tissue dissociation and single-cell sample preparation

收集颌下腺及原发肿瘤标本,置于(DMEM/F12 1:1)、胶原酶1.67 mg/ml (Invitrogen)、透明质酸酶1.33 mg/ml (Sigma)、祛除酶1.67 mg/ml (Invitrogen)中,并用 GentleMacs Dissociator (Miltenyi Biotec) 仪器将其粉碎、解离。细胞悬浮液过70 μm筛,900 g×5 min,4°C离心。小碎块用10ml (DMEM/F12 1:1)重悬,10%FBS的PBS洗涤三次。DAPI染色后过40μm筛网。使用FACS对死亡细胞进行分选,去除DAPI阳性细胞(死细胞)。分选出的活细胞固定在冰冷的80%甲醇中,- 80°C储存备用。

3. Drop-seq procedure, single-cell and bulk library generation, and sequencing

4. CITE-seq experiments

image.png
可见CITE-seq是依赖已有抗体,对特定细胞进行单细胞测序的方法,顺便了解REAP-seq:了不得了,同时测RNA和蛋白
了不得了,同时测RNA和蛋白

5. Immunostainings
6. Processing and analysis of single-cell RNA-seq data,生信工程师上场,原文写得非常非常详细。

image.png

5. Major results (重头戏)

框架:

(1) Single-cell RNA sequencing of salivary gland tumors.
(2) A comprehensive salivary gland cell atlas.
(3) Identification of cancer stem cells and other tumor-specific cell populations.
(4) Simultaneous quantification of mRNA and cell surface proteins resolves immune cell diversity.
(5) Subclustering reveals two subpopulations of cancer stem and basal cells.
(6) Computational lineage analyses reconstruct tumorigenesis.

(1) Single-cell RNA sequencing of salivary gland tumors.

这部分涉及到样本准备的方法,还有测序数据的基本情况。主要目的是:证明样本、数据质量合格。这里的标准是:1)single-cell 测序数据要和bulk-seq数据的相关性高(相关性分析);2)测序深度,测序数据量要够(过滤后查看genes和UMI数量);3)为避免批次效应,作者使用基于熵的测量方法来测定:细胞最近邻在不同样本中的分布有多均匀 (To quantify sample-to-sample variation and the extent of possible batch effects, we developed an entropy-based approach to measure how evenly cells nearest neighbors are distributed among different samples)。

Protocol procedure(如下图)

image.png

1)single-cell 测序数据要和bulk-seq数据的相关性高(相关性分析);2)测序深度;

image.png

可见单细胞测序和bulk的相关性高,并且测序深度,数据量都挺好的(如上图)。

3)数据均匀度

image.png

分析表明,虽然这些分布不完全是随机的,但80%的变异是由三个主要的生物变量(基因型、性别和阶段)引起的(如上图)。

image.png

此外,除了受这些生物变量之一影响的细胞类型外,细胞分布基本上是平衡的(如上图)

总结,1)单细胞测序数据和bulk相关性高,说明单细胞测序数据可以代表样本的情况,证明方法科学可靠;2)通过过滤后,得到足够多的具有一定测序深度的细胞数以及UMI,说明测序过程良好,数据量够,证明数据可靠;3)通过数据处理,消除批次效应后发现,有性别,基因型以及疾病等级会一定程度上影响细胞的均匀程度,但这恰恰是真实情况,描述即可。大的单细胞文章都会把这部分放在补充材料中,这篇文章也不例外。

(2) A comprehensive salivary gland cell atlas.

image.png

为了提供一个全面的唾液腺细胞图谱,也可以作为一个适当的参考肿瘤的背景,作者对control组(唾液腺)的单细胞数据集进行了cluster,并根据已报道的marker来定义每一个细胞簇(上图b)。同样他们也发现了一些性别依赖的marker,以及不同细胞的marker,这些数据放在了补充材料中。之后进行免疫荧光染色,确定不同细胞和表达不同的marker(下图b),并根据这些结果并绘制出解剖结构图 (上图c)。作者还发现,随着时间的变化,细胞proportion也会随之变化(补充材料)

image.png

小结:这些结果提供了cluster结果,这是常规做法,亮点在于解剖结构图的绘制,且解剖结构图还经过免疫荧光染色验证(如果能有连续切片的HE染色结果则数据完整性和说服力更好)。

(3) Identification of cancer stem cells and other tumor-specific cell populations.

注意,本文亮点。作者将control组和double mutant (DM) 的单细胞数据都放在一起,原样又做了一次cluster,诶,发现有一群细胞是在tumor中特有的。发现,在肿瘤环境中具有独特转录特征的上皮细胞簇,包括管腔样细胞和基底样细胞,以及小而独特的癌症干细胞(CSC)样群,其中Wnt特异性基因被激活(如下图)。并发现少数基因是在tumor-specific族群中是特异表达的。

control+DM

利用在单细胞数据挖掘中得到的marker,使用免疫荧光验证后发现,这些高表达细胞确实在肿瘤中出现,可以证明这些gene是tumor-specific的(如下图)。在这里,作者可以明确,他们提出了一个tumor-specific的gene set。

image.png

小结:做单细胞cluster谁都会,但是结合细胞的实际空间位置去寻找特异细胞簇是非常聪明的做法,有免疫荧光的结果验证gene set,使得gene set不仅仅是RNA水平,同时上升到了蛋白水平,更具说服力。

(4) Simultaneous quantification of mRNA and cell surface proteins resolves immune cell diversity.

在做cluster分析的时候,作者已经发现了immune,basal细胞簇是在DM组中比例大,且acinar在control中比例大(如下图),引起作者的注意,并往immune cell这方面继续挖掘。

image.png

对于可以固定住的细胞,做免疫荧光是可行的方法,但是对于免疫细胞则相对困难,在这里作者想到了CITE-seq(参照上面介绍)

image.png

发现:CITE-seq的结果和scRNA-seq的结果确实是重叠的,再一次从蛋白水平验证了scRNA-seq的结果,同时还计算了immune cell proportion的变化,证实DM组中的免疫细胞数量都高于control组,说明肿瘤周边的免疫细胞更多,免疫微环境处于激活状态(如下图)。提示TAMs是广泛而连续的功能状态和分化状态,而不是一个明确的极化肿瘤支持与肿瘤抑制模型 。

image.png

小结:多组学结合之CITE-seq

(5) Subclustering reveals two subpopulations of cancer stem and basal cells.

将某个特地细胞群做subclustering也是常规操作。根据先前的结果,有一群tumor-specific的细胞,是非常适合拿来再分析的(如下图)。

image.png

通过subclustering,作者分出了CSC1 CSC2两个群体,并且发现了它们特异的gene-set(如下图1)。同时发现basal tumor相较于normal,basal tumor具有EMT和matrisome的gene表达特征,并用荧光染色验证EMT是早期basal tumorigenesis的特征(如下图 supplementary figure 10)。

image.png
image.png

小结:根据前期研究结果,将proportion异常的细胞群拿来再cluster是常规操作,使用免疫荧光验证gene set则是不易。

(6) Computational lineage analyses reconstruct tumorigenesis. 人见人爱的大总结

image.png

人见人爱拟时序分析


image.png

人见人爱热图+聚类

总结:basal细胞在分化为luminal-like细胞之前,在β-catenin激活和Bmpr1a功能丧失的情况下,肿瘤的发生由EMT的信号启动,并表现为Wnt差异信号驱动的CSC细胞的异质性(如下图所示)。

image.png

6. Pitfuls & alternative approaches/remaining questions: 略

结语

这篇文章第一次粗略看+做5页内PPT大花费3小时。这次是第二次看,边看边整理出这篇文章,花费约7个半小时。收获很大,第二次看比第一次更细,且终于可以理解文章的大部分细节和思路,这对我们来说是最重要的。精读对了解一个陌生领域非常重要。

上一篇 下一篇

猜你喜欢

热点阅读