单细胞108篇文献解读之1---Phenotype moldin
image.png1 、天魁星 呼保义 宋江
Phenotype molding of stromal cells in the lung tumor microenvironment
基于单细胞测序的肺癌肿瘤免疫微环境中基质细胞的图谱
背景
癌旁的基质细胞,如巨噬细胞,T细胞和纤维母细胞,组成了肿瘤的微环境。肿瘤微环境是一个极其复杂的细胞生态系统,但是这些基质细胞的异质性,以及基质和肿瘤细胞之间的相互影响都还没有明确的研究成果。
本文揭示肺癌微环境的构成,从基质细胞(stromal cell)亚群、信号通路、关键分子以及肺癌患者生存分析四个层面开展研究。
首先作者选择了未经治疗的肺鳞癌 (LUSC) 或肺腺癌 (LUAD) 患者5 例从每个患者同一肺叶的远端区域采集一份正常肺组织样本,并采集三份肿瘤组织样本,快速消化成单细胞悬浮液,进行单细胞测序
image结果是从 52698 个细胞中获得了约2000万个转录本,其中,39,323 个细胞 (75%) 来源于肺肿瘤,13,375 个细胞来自正常组织,在校正之后后,作者根据2192 个基因进行主成分分析,进而将细胞分成了8种不同的亚群:癌细胞、免疫细胞(骨髓细胞、T细胞和B细胞)、纤维母细胞、内皮细胞、肺泡细胞和上皮细胞。不同亚群之间,转录本数目存在显著差别,每个T cell有1,678 trans (764 genes),每个cancer cell有6,746 trans (1,828genes)本图中展示的是t-sne后结果,从左到右分别按照来源、病人、细胞分型和转录本数目进行染色
image接下来,作者分析每种细胞亚型的标记基因,并在t-sne结果图中染色,突变上方每列是细胞亚型,左下角对应标记基因区分细胞类型的标记基因。endothelial cells:CLDN18, FOLR1, AQP4 and PEBP4endothilial:CLDN5, FLT1, CDH5 ,RAMP2epithelial cells: CAPS, TMEM190, PIFO,SNTNfibroblasts,COL1A1, Decorin (DCN) Collagen type I alpha 2 (COL1A2) and C1R 9 ; B-cells,:genes encoding the B-cell antigen receptor complex-associated protein alpha (CD79A),Immunoglobulin Kappa Constant (IGKC), Immunoglobulin Lambda Constant 3 (IGLC3) and Immunoglobulin Heavy Constant Gamma 3 (IGHG3)myeloid cells, genes encoding Lysozyme (LYZ), the Macrophage Receptor With Collagenous Structure (MARCO), CD68 and CD16a, the Fc Fragment Of IgG Receptor IIIa (FCGR3A) 10T-cells:genes encoding CD3D and the T-Cell Receptor Alpha Constant, and Beta Constants 1 and 2. (TRAC, TRBC1 and TRBC2).
image由于在单细胞样本制备过程中,可能刺激细胞产生应激导致转录本发生改变,作者接下来分析细胞与应激相关的基因表达。直方图显示了 52698 个细胞中分离相关基因表达的分数,横轴代表应激相关基因转录本在细胞转录本中的百分比,纵轴代表细胞数量红色虚线代表作者设定的阈值,结果仅有少数细胞 (1.96%) 应激相关基因,划分为应激基因表达阳性。因此,组织分离对细胞的刺激不是影响细胞分型的主要因素。此外作者还考虑到单细胞样本制备时不同组织接力成单细胞的难易程度对细胞分类的影响,所以接下来选取了另一名患者的肿瘤和正常样本进行bulk RNA-seq,发现与单细胞测序数据进行比较,结果有很好的相关性,r = 0.71。
image下图中展示的是不同细胞类型的百分比,绿色代表对细胞群测序的对应的百分比和蓝色代表对单细胞测序的结果。内皮细胞和肺泡细胞不论是真常组织还是癌症组织,对应的百分比都偏低。反之亦然,根据 bulk RNA-seq 分析,免疫细胞类型比bulk mRNA-seq更高组织解聚后不同类型细胞解离效率存在差异,与免疫细胞相比,成纤维细胞和内皮细胞与细胞外基质和基底膜结合牢固,因此解离更困难。
image为了鉴定这 8 种主要细胞类型中的亚类,对每种细胞类型进行了主成分分析,进而将不同的基质细胞分为52个亚群和癌细胞分为12 个亚群。从左到右,依次是来源百分比,病人来源,细胞数目,转录本数目。从第二张图中可以看到,癌细胞亚群具有高度患者特异性。相比之下,基质细胞亚包涵体主要由 3 个或更多患者的细胞组成。
image为了验证分类结果,作者来自另外 3 例 NSCLC 患者的另外 40250 个单细胞的样本进行验证,取样过程与之前相同,同一肺叶3分肿瘤样本和1分正常肺组织,进行单细胞测序,基质细胞可以被匹配到之前到52 个基质细胞亚集群中的 45 个, 45 种亚型 占 52 种细胞亚型中, (87%) 的细胞。另外有 7 种细胞亚型,由于检出细胞小于10个,被舍弃。在完成对基质细胞分型后,接下来作者就每类细胞分别从分型、标记基因、差异表达通路等方面进行详细的分析。首先是:
image对得到的 1592 个内皮细胞进行重新聚类分为 6 个簇Cluster 1:正常组织来源,MT2A +Cluster2 :未发现标记基因,在进一步分析时丢弃。Cluster3 :血液内皮细胞,IGFBP3 +,主要来自肿瘤样本Cluster4:血液内皮细胞,SPRY1 +,肿瘤样本Cluster5:血液内皮细胞, EDNRB +Cluster6:淋巴管内皮细胞,PDPN 和 PROX1
image紧接着作者,对选择的标记基因进行验证,从TCGA的选择正常组织、肺鳞癌和肺腺癌样本,分析标记基因的表达,正常和肿瘤内皮细胞的marker gene分别在非恶性肺和肺肿瘤中富集
image image对内皮细胞转录本表达丰度进行研究,发现肿瘤来源的内皮细胞转录本比正常组织来源的转录本高2-4倍
image对肿瘤和正常内皮细胞的差异表达基因通路分析,肿瘤来源的内皮细胞Myc原癌基因(原癌细胞)在肿瘤来源的内皮细胞活性高,提示肿瘤来源的内皮细胞中转录速度加快,使得转录本数目增多
此外炎症反应相关的通路在肿瘤来源的内皮细胞中下调
进一步分析相关的免疫基因表达,作者基因下调与免疫激活和免疫细胞归巢相关基因下调:HLA-DQA1、HLA-DQB1:主要组织相容性复合体,负责呈递抗原表位CCL2:免疫细胞趋化ICAM1:免疫细胞归巢而血管生成相关的基因表达上调,以上结果表明肿瘤内皮细胞收到肿瘤微环境的影响,下调其抗原呈递和免疫细胞归巢活性,从而有助于肿瘤的免疫耐受。
imageSCENIC分析转录因子活性,筛选出得到的10个最显著差异的转录因子而 Fos/Jun 和 ELF3 的下调以及 FLI1 和 TEAD1 的上调是肿瘤特异性内皮细胞表型的原因
接下来作者分析成纤维细胞
1465个纤维母细胞分成7个cluster
Cluster 1、2、4、5、7在肿瘤中富集
cluster 6:在正常组织中富集,弹性蛋白表达水平较高,而一些胶原蛋白(I, III, V 和VIII)表达水平较低
cluster 3 主要由质量较低的细胞组成,在进一步分析时将其丢弃
紧接着作者,对选择的标记基因进行验证,从TCGA的选择正常组织、肺鳞癌和肺腺癌样本,分析标记基因的表达
由于成纤维细胞通过分泌胶原蛋白影响细胞外基质的成分,作者分析不同亚群较远蛋白基因表达并通过cluster 1 :COL1A1cluster 2:expressing COL4A1cluster 6:COL6A2
image image每个成纤维细胞cluster之间转录因子表达的比较。
MEF2 C 和 ELK3 调控的基因在细胞簇 2 中高度上调,而 FOXO1 和 MSC 调控的基因下调在簇 1 中,HOXB2 和 FOXO1 调控的基因是高度上调的。
tSNE 图,HOXB2 和 MEF2C 的颜色编码表达(分别在顶部和底部),这些转录因子调节子活性的 AUC 估计值(中间)和 GSVA 指示通路的估计值(右)。
不同来源的成纤维小转录因子获悉不同,导致条共计因 活性不同,影响胶原蛋白合成,表明每种纤维原细胞都有功能特异性。
B细胞和巨噬细胞在肿瘤中分布
5603个B细胞分成9个cluster,6个在肿瘤中富集,3个在正常组织中富集(cluster 4、8、9)。滤泡 B 细胞:高水平表达 CD20 (MS4A1)、CXCR4 和 HLA-DRs,富集于cluster1 和cluster2Plasma B:表达免疫球蛋白 γ富集于cluster 3 and 6粘膜相关淋巴组织来源 (MALT) B 细胞:富集于cluster 5 and 7作者对来自TCGA的肿瘤样本和正常组织样本标记基因表达
image接下来,与之前类似,作者进行肿瘤来源于正常组织来源细胞差异表达基因通路分析pathway分析未找到正常组织和肿瘤来源的plasma B细胞或MALT B细胞之间的差异。但作者鉴定出了肿瘤相关的follicular B细胞的氧化磷酸化、细胞增殖相关通路下调;肿瘤相关的follicular B细胞的转录本比正常的低37.9%,提示follicular B在肿瘤中处于耗竭状态
image9756个髓样细胞分成12个cluster,粒细胞对应(簇 7;S100A12 +),三个簇对应于树突状细胞:朗格汉斯细胞(cluster 5;CD207 +),单核细胞来源的树突状细胞(cluster;FCGR3A +,CYTIP +)和交叉递呈树突状细胞(簇 12;CLEC9A + 和 XCR1 +)
cluster 1、2 和 3 未能确定特异性表达的基因
作者对来自TCGA的肿瘤样本和正常组织样本标记基因表达进行验证
肿瘤源性巨噬细胞的炎症反应,TNF-α 诱导的增殖和活性氧产生通路的强烈减少。
imageSCENIC 发现,受 IRF2、IRF7、IRF9 和 STAT2 转录因子调控的基因在一部分肿瘤相关巨噬细胞中上调,而 Fos/Jun 和 IRF8 调控基因表达下降。值得注意的是,IRF2 在巨噬细胞中具有免疫抑制作用,而 Fos/Jun 可以增强巨噬细胞的炎症反应,
巨噬细胞按照其表型和分泌的细胞因子可以分为两种极化类型,即经典活化(Classically activated)的M1型和选择性活化(Alternatively activated)的M2型巨噬细胞。巨噬细胞的极化分型在肿瘤、脂肪等多数组织中广泛存在,并对某些肿瘤的预后有指导意义
这些数据支持人类肿瘤中肿瘤巨噬细胞的 M2 极化,并确定 NSCLC 中这些变化背后的引人注目的候选转录因子。
肿瘤T细胞转录组揭示了新的免疫治疗靶点
检测到 24911 个细胞,T 细胞发现了 9 个簇,分别被指定为调节性 T 细胞(FOXP3 +,簇 7),自然杀伤和自然杀伤 T 细胞(FGFBP2 +,簇 6),CD8 + T 细胞(CD8A +;2,4,5 和 8)和 CD4 + T 细胞(CD4 +;1,3 和 9)
image比较了肿瘤和非恶性肺 T 细胞的通路表达水平。不同 T 细胞表达大致相同例如
糖酵解上调和减少氧化磷酸化。此外,除了肿瘤特异性、增殖性
CD8 + T 细胞簇 8 以外,肿瘤源性 T 细胞的细胞增殖途径普遍较低。
T 细胞亚型之间的一些通路存在差异调节。对于 CD8 + T 细胞IFN-γ 和 IFN-α 上调、Myc 活性和较高的颗粒酶表达,均表明 T 细胞活化。同时,它们表达较高的免疫检查点分子水平,包括已批准的靶点 PDCD1 和 CTLA4,但也包括目前临床试验中靶向的其他靶点(LAG3、TIGIT、HAVCR2/TIM3、CD27 和 TNFRSF9/CD137)(图 5f)34。所有这些分子也与通过平均颗粒酶(GZMA、GZMB 和 GZMH)表达测量的 T 细胞活性相关(图 5g),表明受高检查点表达的限制。基质细胞在肿瘤中的分布及其与病人存活的关系
image缺氧与肿瘤行为的许多重要方面相关,包括血管生成、转移、代谢调控基因和免疫逃逸。因此我们将每个肿瘤分为3部分:肿瘤核心部位、中间部位和边缘,探究癌细胞的分布情况。结果发现,在更缺氧的肿瘤核心的癌细胞比中间和边缘更多;而大部分基质细胞在含氧量正常的肿瘤边缘富集。图b是距离肿瘤核心或边缘距离与肿瘤细胞数量线性模型的T值,显示肿瘤核心或边缘富集基质细胞团。肿瘤细胞和缺氧两个特性比较偏重分布于core和middle,而b图中不同的基质细胞则偏重分布于edge
imageLUAD 中标记基因的平均表达(n = 501)或 LUSC(n = 513)样本,在 TCGA 中使用 RNA-seq 进行表征。基质细胞类型显示 > 2 倍的变化之间的表达两种癌症类型命名和突出。
42个细胞亚型中,只有9个细胞亚型的marker gene在LUAD和LUSC之间的表达有显著差异。其中两种亚型的表达差异可能反映了肺肿瘤的细胞起源,其中LUAD来源于AT2细胞,LUSC来自基底细胞。CD8 T-cell cluster 8和纤维原细胞 cluster 5可能反映了组织病理学的差异
image此外,本文评估了TCGA数据库中1572名病人(1027 LUAD和545 LUSC)的细胞亚型与病人存活率的关系。通过对患者年龄、性别和肿瘤时期等多变量校正分析发现,基质marker gene表达增加时LUSC病人的存活率下降,而非LUAD病人(Fig.6d)。如flat AT1 cells, respiratory epithelial cells and cross-presenting dendritic cells高表达时LUSC病人存活率降低,而CD8+ T-cells cluster 8正好相反。
小结
-
对5位肺癌患者共19个样本进行单细胞转录组测序,并对另外3位患者进行单细胞测序验证,证明了基质细胞之间存在很强的个体间差异,表明聚类得到的52种细胞亚型覆盖了肺TME的大部分细胞异质性。当比较肿瘤和匹配非恶性肺时,许多基质细胞亚群都是由肿瘤衍生或肺组织衍生的细胞组成的,主要的细胞类型包括内皮细胞、成纤维细胞、B细胞、巨噬细胞、T细胞、肺泡细胞和上皮细胞。
-
对上7种主要基质细胞类型进行更详细的研究,发现:肿瘤内皮细胞MHC I 、MHC II和ICAM1等基因表达下调,提示其抗原呈递和免疫细胞归巢能力被下调,从而促进了肿瘤的免疫耐受;肺肿瘤有五种不同类型的成纤维细胞,并且每一个纤维细胞类型都表达了一种独特的胶原蛋白和其他细胞外基质分子;B细胞在肿瘤中有很强的富集,聚类显示有9个亚群,包括高表达CD20的滤泡B细胞在内的6个亚群在中肿瘤中高富集,并且滤泡B细胞在肿瘤中耗尽处于耗竭状态;在肿瘤中巨噬细胞表现出变阻表型并在肿瘤中形成M2极化;肿瘤T细胞转录组分析提示在CD8+肿瘤浸润T淋巴细胞中促进脂肪酸分解代谢,可以增强了他们减缓肿瘤恶化的能力。
-
肿瘤核心中有更多的癌细胞,它们的缺氧程度高于边缘样本。研究不同基质细胞marker表达与TCGA数据库中患者预后的关系时发现,肺鳞癌(LUSC)在较高的阶段表现出许多基质成分的减少,而在腺癌(LUAD)中观察到的与阶段相关的变化很少,并且在LUSC中高基质标记表达和降低生存率相关。
原文链接
作者:珠江肿瘤