为什么别人的常规单细胞分析就可以发Oncogene?[夹带干货]
肺癌的生存率低和预后差已广为所知,作为全世界范围内发病率和死亡率都非常高的一种癌症,其单细胞方向的研究也非常广泛了。今天给大家介绍的这篇肺腺癌的单细胞文章[Oncogene:9.867],为我们提供了一个新的思路。
Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma

一、数据和代码:
数据:
10个正常肺组织和10个肺腺癌组织的单细胞RNA-seq数据
https://doi.org/10.24433/CO.0121060.v1
代码:
https://doi.org/10.24433/CO.0121060.v1
https://github.com/bischofp/single_cell_lung_adenocarcinoma
【这篇文章给的代码十分清晰,尤其是单细胞数据的前期处理和细胞注释;以及文章中每个结果和图,包括作者的数据和代码结构,大家都可以借鉴学习】

二、背景:
肺癌预后差,占全世界癌症新发病例和死亡人数的大多数。肺癌最常见的亚型,尤其是不吸烟者,是肺腺癌。在本研究中,作者通过单细胞RNA测序分析了肺腺癌肿瘤微环境中的肿瘤上皮细胞和相关非恶性细胞。发现患者肿瘤微环境的异质细胞组成遵循与癌细胞分化等级相关的特定模式。将我们的研究结果转化为一个以bulk基因表达为特征的回顾性队列,揭示了微环境模式的潜在预后相关性。作者的结论是,对肺腺癌微环境的全面分析可能有助于揭示基于癌细胞和微环境特征的新的临床相关肿瘤亚型。
三、内容和结果:
(一)单细胞RNA测序揭示肺腺癌细胞多样性
为了研究肺腺癌的细胞组成,收集10份正常肺组织和10份肺腺癌组织样本,并对其进行单细胞RNA测序,在质量控制和筛选后产生114489个高质量的单细胞转录组数据(Fig. 1A)。
通过UMAP进行分析和可视化显示,不同组织类型或患者的单细胞转录组混合在许多簇中,去除批次效应后,部分形成肿瘤或患者特异性簇,表明潜在的生物学差异(Fig. 1B,C)。
为了揭示哪些细胞最能解释患者间的异质性,作者分析了上皮、免疫和基质细胞marker基因表达的单细胞转录组。总共覆盖了20450个上皮细胞、89766个免疫细胞和4273个基质单细胞转录组。
上皮转录组的产量因组织学亚型而异,因为我们观察到实体/肉瘤样癌的频率<10%,而鳞状细胞癌/腺泡癌的频率高达>40%。上皮细胞表现出最高程度的患者间异质性(Fig. 1D)。

(二)肿瘤上皮细胞的瘤间异质性反映了分化梯度
为了进一步分析上皮细胞中患者间的异质性,对上皮转录组重新聚类。基于组织起源,Cluster被定义为正常或肿瘤,其与细胞的拷贝数状态基本一致,并证明肿瘤纯度>90%。
基于典型基因marker和基因Signatures,注释细胞类型。肿瘤细胞cluster与正常细胞细胞cluster分离,肿瘤细胞主要是患者特异性的,表明肿瘤间异质性(Fig. 2A,B)。
肿瘤上皮细胞中的差异表达基因按患者分组,每个患者最多显示前十个基因(Fig. 2C)。不同患者免疫染色表明EGFR、TFF3、CDKN2A和SFTPA2与蛋白质表达相关(Fig. 2D)。
按患者分组的肿瘤上皮细胞平均通路活性得分(Fig. 2E)。
尽管存在明显的肿瘤间异质性,作者注意到上皮肿瘤细胞转录组在患者亚组中的共同特征。为了强调肿瘤之间的相似性,上皮转录组被嵌入低维UMAP中。基于所有肿瘤上皮单细胞转录组基因表达的主成分分析;沿着PC1的肿瘤细胞特征模块分数示意图(Fig. 2F、G、H)。

(三)、肌成纤维细胞的两种亚型构成了肿瘤基质微环境
第三部分主要介绍肺腺癌间质微环境的组成,作者首先正常和肿瘤组织样本中的基质细胞进行了分类和分析,根据不同marker的表达主要分为内皮细胞、淋巴管内皮细胞、成纤维细胞、肌成纤维细胞、平滑肌细胞和间皮细胞(Fig.3A、B)。
检测到肿瘤组织中成纤维细胞向肌成纤维细胞簇的转移,并且在一个独立的数据集中也观察到了这一点。
值得注意的是,肌成纤维细胞簇2几乎只存在于肿瘤组织中,而肌成纤维细胞簇1包含正常组织和肿瘤组织。通过对间质微环境中不同细胞类型差异表达基因,发现肌成纤维细胞簇2高表达COL3A1、COL5A1等基因,表明其在细胞外基质重塑中起作用(Fig.3C)。
同时,通过计算不同细胞类型信号通路活性,发现肌成纤维细胞簇2表现TGFβ和JAK/STAT信号的高活性以及缺氧诱导相关通路(Fig.3D)。而两个cluster的相关性分析(Fig.3E)、免疫染色(Fig.3F)验证肌成纤维细胞簇1和簇2分别代表肌成纤维细胞的“正常样”和“癌症相关”表型,并且它们中的任何一个都可以主导基质微环境。

(四)肿瘤免疫微环境表现出促炎和非炎症特性
第四部分作者对免疫细胞进行了分类和分析,通过分析发现肿瘤免疫微环境的细胞组成发生了显著的定量变化(Fig.4AB)。
然后分析不同巨噬细胞cluster的炎症和M1/M2极化相关的模块得分,发现cluster 2表达高水平的促炎性趋化因子,如CXCL9和CXCL10、促炎性细胞因子IL1B,以及与免疫反应和M1极化相关的基因特征(Fig.4C)。
通过在患者内的促炎症和非炎症的相关性分析,确定巨噬细胞cluster 1和2分别代表非炎症和促炎症功能(Fig.4D)。
通过CXCL9和CD123免疫染色验证促炎性单核细胞源性巨噬细胞cluster 2和浆细胞样树突状细胞的分布(Fig.4E)
分析CD8+T细胞不同cluster的耗竭得分和毒性得分(Fig.4F)。确定耗竭型的CD8+T细胞与促炎性单核细胞源性巨噬细胞和浆细胞样树突状细胞数量显著相关(图4G)。
综上所述,作者确定了从正常肺组织到腺癌患者免疫细胞成分的总体变化,以及导致患者间异质性的不同肿瘤免疫微环境模式。

(五)、肺腺癌的肿瘤微环境主要有两种类型
为了分析肿瘤微环境中不同细胞普遍性,计算患者骨髓细胞、淋巴细胞、内皮细胞和成纤维细胞/肌肉细胞的细胞比例。
基于基质细胞和免疫细胞簇的比例,利用主成分分析,发现肿瘤根据肿瘤微环境的细胞组成形成亚群(Fig.5A)。
基于肿瘤微环境的组成,将患者分为不同的亚组——两种不同的模式(Fig.5B),分析基质细胞和免疫细胞cluster细胞比例的相关性(Fig.5C)。
量化两种模式的受体-配体互作(Fig.5D)。为了测试肿瘤微环境模式是否可以通过患者队列中的bulk基因表达模式来重现,分析TCGA中533名肺腺癌患者的marker基因的表达。
研究这些患者亚组的生物学和临床相关性,分析TCGA肺腺癌队列中不同基因特征表达的总体生存率。与CP²E模式的特征相比,N³MC相关基因特征与更好的总体存活率相关。


四、结论:
我们来总结一下这篇文章的整体思路,在拿到肺腺癌的单细胞数据后,正常组织细胞类型和肿瘤微环境中主要细胞类型——上皮细胞、间质细胞、免疫细胞;最后根据肿瘤微环境组成,将患者划分为两种模式,并在大规模的bulk数据中得到了验证。
文章的思路非常简单,其精彩的点除了最终根据微环境的组织发现患者可以分为两种模式外;前期的研究非常细致,一点点的解析不同的细胞类型。这样看来,这篇文章确实很值得学习和借鉴,虽然大家对常规的单细胞流程都比较熟悉了如经过常规的处理和过滤,但是这篇文章的规范化,值得一览。
最后给大家一个干货,作者用来注释细胞类型的marker。对细胞类型marker没有总结和记录的崽崽们,拿走不谢。其他肿瘤或细胞类型的marker,大家可以参考相关数据库。
笔记:
识别细胞类型
获得细胞类型已知的marker【从文章或者cellMarker、ImmGen数据库】
通过前期处理后,将细胞进行聚类,识别cluster特异的基因【“Seurat v3 】
对cluster赋予相应的细胞类型【根据marker的表达情况,如果cluster特异高表达某类细胞marker(log2 FC值和FDR_p值在top5或top10以内的差异基因)】
正常细胞类型,一般其marker比较固定,即通过某些marker基因/蛋白的组合就能唯一确定该细胞类型。
有些细胞类型,可以分成多种更为特异的细胞类型,如文章中对免疫细胞、间质细胞的分类等。

参考文献:
Single-cell RNA sequencing reveals distinct tumor microenvironmental patterns in lung adenocarcinoma [published online ahead of print, 2021 Oct 18]. Oncogene.