EcoTyper:识别肿瘤中各种细胞的生态位-血液肿瘤
前言
弥漫性大B细胞淋巴瘤(DLBCL)是一种起源于成熟B细胞的血液恶性肿瘤。不同的患者在临床表现和生物学特性上展现出显著的异质性,这可能与其起源细胞、遗传变异以及肿瘤微环境的不同有关。那么深入解析这些异质性对于找到更为有效的治疗策略至关重要。
在上一期的推文中EcoTyper:识别肿瘤中各种细胞的生态位-实体肿瘤,我们一起了解了EcoTyper分析框架以及如何在实体肿瘤中大规模地识别和验证细胞状态和内部生态系统。在本期推文中,我们将进一步学习如何将EcoTyper应用于血液肿瘤,以揭示与临床相关的细胞状态和内部生态系统。在本研究中,作者将其应用于DLBCL鉴定出13种细胞类型和44种细胞状态,系统性地解析了DLBCL的复杂异质性。
接下来,让我们来一起学习一下这项研究吧(ps:后续会和大家一起学习EcoTyper的代码实操哦)。
主要内容
1. 使用EcoTyper 发现并解析细胞状态
作者开发了一个从复杂组织中大规模地识别和验证细胞状态和多细胞生态系统(相互作用)的工具--EcoTyper。具体来讲,EcoTyper使用CIBERSORTx从Bulk组织转录组中获取特定细胞类型的基因表达信息。接着,基于这些基因表达信息,在每种细胞类型中识别出基于基因转录特性定义的不同细胞状态,并在外部表达数据集中(包括scRNA-seq)进行验证,从而确定并定义稳健的细胞状态和共存的细胞状态模式(哪些细胞状态经常一起出现)。
为了在DLBCL中使用EcoTyper,作者整合了涵盖多种恶性和健康淋巴组织标本的bulk和scRNA-seq数据(数据中包括了治疗、COO亚型、临床结果,以及体细胞突变等信息),其中包含4套Bulk数据,1套作为发现集,另外3套作为验证集。此外,作者整合了自测数据(scRNA-seq和scVDJ-seq)以及5套公开scRNA数据集,得到了一个包含173,028个来自45个组织标本的全淋巴组织图谱,并将其注释为了13种细胞类型:B细胞、浆细胞、CD8 T细胞、CD4 T细胞、CD4调节性T细胞、CD4滤泡辅助性T细胞、自然杀伤(NK)细胞、单核/巨噬细胞、树突细胞、嗜中性粒细胞、肥大细胞、内皮细胞和成纤维细胞。随后,作者使用CIBERSORTx对具有已知组成的标本进行去卷积。结果表明,无论是在已知肿瘤含量的真实的DLBCL转录组还是从scRNA-seq数据重建的模拟组织,细胞比例估算都与预期的真实值高度一致。

2. 1.6k例肿瘤中DLBCL B细胞状态图谱
作者首先将EcoTyper应用于发现集(n = 522),算法首先使用CIBERSORTx,获得了13个特定细胞类型的基因表达谱(GEP)。由于每个GEP可能同时代表多种细胞状态,EcoTyper使用非负矩阵分解(NMF)来分离这些不同的细胞状态(每个GEP都被自动重构为离散转录程序(即"状态")的加权组合)。作者识别出44种不同的细胞状态,每种细胞类型的状态数量从2个到5个不等。EcoTyper在DLBCL肿瘤中识别出5种B细胞状态,其中一些状态与已知的GCB(生发中心B细胞样)或ABC(激活B细胞样)亚型有关。如S1状态表现出与GCB-DLBCL相关的典型标记基因的高水平(MME、LMO2和MYBL1),而S4和S5状态表达了ABC-DLBCL的标记基因(S4中的PTPN1和S5中的PIM1)。此外,当根据B细胞状态对肿瘤样本进行分类时,COO(cell of origin)亚型在不同的状态之间(S2–S4)广泛分布,并在3个bulk验证数据集中得到了一致的结果。
接下来,作者在单细胞水平上对每个细胞状态进行验证。EcoTyper可以使用有监督的机器学习方法将单细胞的转录组数据与预先定义好的细胞状态相对应,并评估这些状态的显著性。作者使用EcoTyper对DLBCL肿瘤和其他淋巴组织的117,869个B细胞进行分类。结果表明,所有B细胞状态都可以轻松地以高统计置信度检测到。大多数B细胞状态在肿瘤样本中富集,但S3在正常的淋巴组织中富集(肿瘤组织中也可以检测到)。
作者在确定了5种B细胞状态后,进一步研究这些状态与患者的基因突变模式和总体生存(OS)之间的关联。首先作者探究了B细胞的状态与LymphGen亚型(是基于其突变模式与患者的临床结局之间的关系被定义的)是否有关。结果表明,虽然一些状态在LymphGen亚型中富集(例如,EZB DLBCL中的S1),但大多数富集的程度都较为适中,并存在一部分肿瘤是完全不能被LymphGen分类的。接下来,作者探讨了B细胞状态是否与Chapuy等人描述的C1-C5基因亚型有关联。结果表明,3种B细胞状态在Chapuy等人描述的基因亚型中有一定的富集,即S1、S4和S5分别与C3、C1和C5亚型有关。最后,作者探索了B细胞状态与患者生存之间的关系,结果表明5种状态能够区分患者的生存率。此外,与COO相关的状态(S1和S5)在单因素生存模型中预测了有利(S1)和不利(S5)的结果。作者在统计模型中考虑了多种可能影响生存的因素(如COO、LymphGen分类和C1-C5亚型)后,发现S5(一个富含ABC特征的状态)和S2(一个在细胞起源上具有混合特征的状态)仍然与患者的总体生存有关。这意味着,即使考虑了其他多种因素,这些B细胞状态对预测患者的生存仍具有重要意义。

3. 解析临床上不同的DLBCL B细胞发育轨迹
为了深入了解DLBCL中的B细胞状态,作者对比了DLBCL和正常B细胞的表型差异。首先,作者检查了DLBCL中定义的标记基因是否能在正常淋巴结的B细胞中区分出5种细胞状态,发现这些状态在健康的扁桃体和反应性淋巴结的scRNA-seq数据中都存在。接着,基于淋巴样scRNA-seq数据,作者拓展了标记基因列表,并比较了每个状态与已知的扁桃体B细胞表型。结果显示,S1状态与生发中心B细胞相符,S2和S3与前记忆B细胞匹配,而S4和S5与前浆细胞母细胞对应,其中S4特指光区B细胞。然后,为了看DLBCL中的B细胞状态是否遵循正常发展轨迹,作者利用了CytoTRACE工具对状态进行排序。结果显示,S1状态的分化程度最低,而其他状态分化程度相对较高。
从Bulk数据中,我们知道GCB DLBCL来源于生发中心B细胞,但ABC DLBCL的起源尚不明确。为深入探索DLBCL的起源,作者整合了4个初发DLBCL(3个ABC和1个GCB)的配对scRNA-seq和scVDJ-seq数据。作者分析了拷贝数变异(CNVs)并进行了细胞条码与免疫球蛋白VDJ组交叉引用。结果表明,在GCB肿瘤中,恶性细胞广泛分布于所有状态,而ABC肿瘤中,恶性细胞主要集中在S2至S5,S1几乎没有。3套scRNA-seq和1个1133个样本的Bulk数据也证实了这一结果。模型结果表明GCB型起源更早,位于S1阶段,而ABC型则位于S1的后续阶段,但在发展成完全的记忆B细胞或浆细胞之前。值得注意的是,这个模型代表了一个伪时间排序,并不意味着记忆前B细胞和浆细胞样细胞系从生发中心前体细胞同时分化出来。总的来说,这些发现进一步澄清了GCB/ABC背后的COO层次结构,并为DLBCL的起源和发病机制提供了见解。

4. DLBCL肿瘤微环境的预后图谱
接下来,作者研究了DLBCL的TME多样性及其与临床的关联。使用EcoTyper,作者从DLBCL的12种免疫和基质细胞中确定了39种TME状态。这些状态在6个DLBCL scRNA-seq数据集中表现出良好的重复性。接下来,作者探索了细胞状态与生存的关系,发现大多数TME状态在单因素cox模型中都具有显著的预后意义,并且在不同的队列之间观察到了一致的趋势。
虽然恶性B细胞与更高的死亡风险最为相关(B细胞状态S5),但也发现有8种TME细胞状态与良好预后关联。在这8种状态中,有7种在对COO、LymphGen或C1-C5亚型进行多因素调整后仍然具有显著性,其中单核细胞/巨噬细胞S2(M1-like)和CD4 T细胞S3(naïve)在考虑了COO后其显著性超过了其他状态。

5. ABC和GCB DLBCL的细胞组成及群落结构
COO(cell of origin)对DLBCL患者的生存率至关重要。作者使用EcoTyper对bulk肿瘤和带COO标签的DLBCL单细胞数据进行了深入分析。在bulk数据中,CD8 T细胞、CD4 T细胞、滤泡辅助T细胞、调节性T细胞(Tregs)和巨噬细胞显示了COO特异的表达模式。此外,与预期结果相一致,在GCB和ABC DLBCL中富集的TME状态分别与有利和不良的结果相关联(临床上,GCB-DLBCL的患者的预后比ABC-DLBCL的患者好)。接下来,作者想知道TME状态是否展示了与COO相关的表达模式。在ABC DLBCL中,浸润T细胞广泛过表达了共刺激和共抑制分子,相比之下,与GCB DLBCL相关的T细胞通常在免疫调节分子上是缺乏的。这显示了两种DLBCL在免疫反应上的差异,可能影响免疫治疗效果。接下来,作者进一步揭示了ABC和GCB中各细胞状态的关联模式。在发现集,通过对细胞状态丰度进行无监督聚类,作者发现了ABC DLBCL内的四个明显的亚组(n = 4)以及GCB DLBCL内的三个亚组(n = 3),这些亚组与不同的临床结果相关联并在其他独立样本集中也得到了验证。

6. DLBCL的多细胞生态系统
不考虑细胞起源(COO),作者通过最大化共同关联模式的聚类方法,揭示了DLBCL中的9种独特淋巴瘤生态型(LEs)。这些LEs在细胞构成和数量上存在差异,并展现出不同的细胞间相互作用(使用CellPhoneDB预测的)。它们也可通过临床、细胞和遗传特征进行区分。值得注意的是,8个LEs在所有数据集中均与患者预后显著相关。LEs 1至3与不良预后有关,LE1和LE2与ABC DLBCL紧密关联,而LE3与双double-hit淋巴瘤有关。LE4在ABC DLBCL中富集,特征是B细胞数量减少和广泛表达共抑制和共刺激分子的T细胞状态(CD8 S4, CD4 S2, Treg S4)。LE5虽与疾病预后无关,但在正常淋巴组织中常见。
另一方面,与良好预后相关的LE6至LE9中,LE8尤其在GCB淋巴瘤及其相关的基因型病变(EZB, ST2, C3和double-hit淋巴瘤)中富集。而LE6、LE7和LE9的基质相关基因表达增加。先前研究已将如Stromal-1这样的基质细胞特征与良好预后联系起来。通过EcoTyper,作者进一步明确了这些特征背后的具体细胞表型和LE类别,例如具有LAMA4标记的与肿瘤相关的内皮细胞在LE7中,而具有POSTN和THBS2标记的与癌症相关的成纤维细胞在LE9中。此外,LE9不仅在成纤维细胞和其他肿瘤微环境中富集,而且还预示着更长的生存时间(p < 10^-6)。

7. 使用EcoTyper对DLBCL进行疗效预测
虽然有许多用于评估DLBCL患者风险的指标(国际预后指数、COO、遗传亚型等),但目前这些指标并不直接用于治疗选择的决策。作者基于加入bortezomib治疗(RB-CHOP方案)和单独的标准治疗(R-CHOP方案)数据,使用EcoTyper探索RB-CHOP治疗的潜在效果。对于每一种状态,进行单因素cox分析并进行调整得到OS Z分数,在44个状态中,CD8 T细胞S1与从RB-CHOP获得的治疗效益最为显著相关(p = 0.004,q = 0.04)。由于CD8 T细胞S1比其他CD8 T细胞状态表达更高水平的CXCR5,已有报道表明CXCR5+ CD8 T细胞存在于B细胞滤泡内,并在滤泡性淋巴瘤中具有抗肿瘤活性。空间转录组学分析正常人类淋巴结中的空间分布时,相比于其他CD8 T细胞状态,富含CD8 T细胞S1的区域明显更靠近B细胞滤泡。因此,基于这些数据作者将CD8 T细胞S1与之前描述的CXCR5+ CD8 T细胞状态相联系。最后,作者探索了CD8 T细胞S1对患者生存的预测,发现其比COO预测预后的性能好。总的来说,这些结果表明CXCR5+ CD8 T细胞与RB-CHOP的疗效有关,并强调了EcoTyper在系统识别与临床结果预测相关细胞状态的潜力。

小结
总的来说,EcoTyper是一个强大的分析工具,通过揭示细胞状态和细胞生态系统从而解析疾病异质性。在这项研究中,作者以DLBCL为例,揭示了DLBCL的13种细胞类型的44种细胞状态,其中恶性B细胞的5种细胞状态在预后相关性和分化状态上有所不同。此外,作者发现TME的另外12种细胞的39种细胞状态中的一部分也具有良好的预测预后的潜力。
作者首先对这些细胞状态进行分类,定义了“淋巴瘤生态型”(LEs)。每种LEs在细胞组成和数量上都有所不同,并且展现了独特的细胞间互动模式。这些LEs与各种临床、细胞和遗传特征之间的密切关联使其成为预后评估的宝贵资源。此外,为了展示EcoTyper在实际应用中的价值,作者还以特定药物为例,展示了如何运用这款工具来识别与疗效相关和与临床预后相关的细胞状态。综上所述,EcoTyper深入地揭示了DLBCL的复杂临床异质性,这为我们提供了一个系统性的视角来理解DLBCL及其微环境,并为未来的治疗方法提供思路。
好啦,本期分享到这就结束了,我们下期再会~
[参考文献]
Steen CB, Luca BA, Esfahani MS, Azizi A, Sworder BJ, Nabet BY, Kurtz DM, Liu CL, Khameneh F, Advani RH, Natkunam Y, Myklebust JH, Diehn M, Gentles AJ, Newman AM, Alizadeh AA. The landscape of tumor cell states and ecosystems in diffuse large B cell lymphoma. Cancer Cell. 2021 Oct 11;39(10):1422-1437.e10. doi: 10.1016/j.ccell.2021.08.011IF: 50.3 Q1 . Epub 2021 Sep 30. PMID: 34597589IF: 50.3 Q1 ; PMCID: PMC9205168IF: 50.3 Q1 .