文献速读Immune phenotypic linkage be
研究的问题:结直肠癌与肝转移的免疫表型关联
详细说,肿瘤微环境(TME)的各种免疫细胞类型会影响癌细胞的进展和转移,因此想了解可能塑造TME的内在和外在因素(看微环境种哪些细胞塑造了肿瘤环境,或者哪些细胞被肿瘤环境而塑造),以及原发和转移部位免疫细胞的联系
研究对象:CRC肝转移(CRLM)和原发性HCC / CRC患者
原则上,癌症类型之间的TME差异可能是由正常组织(局部组织微环境)和恶性肿瘤的组合引起的,对不同的免疫成分具有可变的影响。然而,正常组织的微环境或恶性肿瘤的相对贡献很难辨别,因为它们对给定肿瘤TME的影响是交织在一起的。原发性肿瘤细胞播种转移器官的过程提供了一个独特的系统来解开肿瘤TME是如何被塑造的。对于转移性肿瘤,已知混合细胞成分是从"种子"(来自原发肿瘤的迁移癌细胞)和"土壤"(器官特异性微环境)开始的。由于转移性肿瘤的癌细胞来自同一个体内的原发肿瘤,但存在于不同的器官中,因此根据自体采样来解开正常组织微环境成分和恶性肿瘤对TME的影响变得可行。
关键假设:表型相似,则功能相似。
详细说,先将转移后的微环境中免疫细胞与其他环境下的相同免疫细胞比对转录组学表型,基于的假设是在不同组织中具有相似转录组学表型的细胞可能具有相似的微环境或生态位,因此不管该细胞是被环境塑造还是塑造环境,如果和肿瘤微环境中的自己表型像,那就先分类为与癌症相关类型,其表型主要受肿瘤细胞决定(M-type)。M-type例如在原发肿瘤位和肝转移位存在大量相近表型的Tex细胞,而在其他组织中不存在或极少。
分类思想如下 M-type(与"原发性肿瘤"组织相似度高),N-type(与"相邻肝脏"相似度高)和C-type(与"原发性肿瘤"和"相邻肝脏"相似度都高)。
主要思路:先分类,在验证。
详细说,fig2.c的分类方法是全篇的重点,也是自己他们提出的新的量化方法(结合KNN分类和转录组学数据),用他们的方法分类之后,使用利用公开数据库信息验证,一般是使用公开RNA表达谱数据,通过基因功能验证,也通过预后信息验证。
fig.1图A是样本信息,图B, C是简单的单细胞分群信息。
图A, CRLM转移前的癌和癌旁;转移后的癌和癌旁都取样,特殊的是MLN。同样HCC多取了淋巴结。
在这里我关心的是样本数,样本数17*6=102 18*3=54 16*4=64 可以发现相同疾病患者的取样数目并不都相同。但是文中没有提到原因,需要仔细检查附表。
图B,C 就是简单的分群,但是他们的方法很新,首先是scanpy,Seurat虽然是10X的官方包,但内存占用太大,据测试,十个样本,98000个左右细胞数量的文件,在完成聚类以及umap降维分析之后,全部载入R中需要消耗近40G的内存(普通家用电脑的处理器内存仅为8G左右),如果加上后期其他分析所需的内存开销,就算正常的超算服务器配置都难以招架。基于这种情况,开发人开发了Scanpy(Single-Cell Analysis in Python), 使用Python来实现,占用内存小且速度快。
其次是UMAP聚类算法,Scanpy与Seurat类似支持了PCA、t-sne、umap等降维方法,也体现了不同的三代降维方法。以t-SNE为代表的非线性降维技术,由于其能够避免集群表示的过度拥挤,在重叠区域上能表示出不同的集群而被广泛运用。然而,任何技术方法都不是完美的,t-SNE也一样,它的局限性体现在丢失大规模信息(集群间关系)、计算时间较慢以及无法有效地表示非常大的数据集[6]等方面。在小数据集上差别不明显,但是umap在大数据集上优势明显,主要是速度和结果上。
总结:A图的取样需要查看附表,BC的分析包(scanpy)和降维算法(UMAP)值得学习,因为现在的单细胞数据量大,以前的工具对小数量的细胞设计,在大量细胞上表现不佳很正常,因此要学习新技术。
fig2图A ,B 是一类,都是简单的方差分析(Analysis of Variance,ANOVA),看差异。但是缺点是无法利用scRNA-seq数据集的大细胞数提供的统计能力来剖析种子和土壤对转移性TMEs的影响。
因此,基于这个问题,他们提出了自己的统计学方法用来”对齐“表型,接下来的C图是全篇的重点:基于的假设是在不同组织中具有相似转录组学表型的细胞可能具有相似的微环境或生态位,因此外在调节因子可以被共享以塑造相似表型的形成。即,表型相似,则功能相似,不管该细胞是被环境塑造还是塑造环境。
M型(以"原发性肿瘤"为重要组织),N型(以"相邻肝脏"为重要组织)和C型(以"原发性肿瘤"和"相邻肝脏"为重要组织)。
类型解释:比如M类,即其表型主要受肿瘤细胞决定:在原发肿瘤位和肝转移位存在大量相近表型的Tex细胞,而在其他组织中不存在或极少。
要分析的是:肝转移中免疫细胞与其他组织的表型联系
所以其功能:看肝转移中免疫细胞与其他癌症and /or正常组织相似,从而分类为M型(促癌作用),N型(正常型,抑癌作用)C型(又像癌症又像正常型)
此后的图全是基于这个计算得到的分类假设,去验证其分类的准确性,从而验证细胞的功能。
D图 虚线是查询的细胞,而周围的5个不同色的是癌症 /正常组织,图很好懂,在哪个组织上显著就是像哪个组织中的同类细胞及功能。后面这5个颜色以及这个图的变体会一直在,只是变成小提琴图,但是颜色都是统一的。
fig3开始对分群的细胞以此进行研究,分别是CD8 T细胞, CD4 T细胞 ,TAM, DC ,本部分从CD 8 T细胞开始研究。
研究组分:CD8 T细胞
研究对象:CRLM,主要是Liv.mets(转移位)Pri.CT(原发位)
AB就是前面说的圈图的变体,变成小提琴图,还是和癌症显著则为M型,和正常组织相同则为N型,图中不显示作为比对的结直肠癌肝转移的肝部癌组织ETM,只显示作为对照的5种组织。
分类也很好理解,耗竭的T细胞与癌症微环境相关,而tem temra和正常表型相关。因此这个不太需要验证,于是他们的重心放在讲解他们的新发现上。
这里的新发现是一大部分转移前后的肿瘤微环境中Tex上面的t细胞受体TCR相同,可能有相同起源,但是这与已知的tex特性不符,tex几乎不会随着种子(癌细胞)移动。因此他们假设两个位置的tex可能来自同一起源,为图G,DC呈递抗原给Tn,分化为temra,分别到达转移前后的肿瘤位置,进而分化为tem,tem浸润进肿瘤细胞并耗竭,无法再起到t细胞的作用。另外在这个过程中还通过RNA velocity 分析得知temra和tem是可以相互转化的,如图F所示意。
那么我们回到最重要的假设在回顾一遍文章的思路:Tex属于M-type(类似于肿瘤微环境中的自己),但它是被肿瘤环境塑造,可以被分类为与癌组织环境相关。
fig4研究组分:CD4 T细胞
研究对象:依旧是CRLM,主要是Liv.mets(转移位)Pri.CT(原发位)
同样,重点关注的仍是M-type的那些细胞
图A,Th 和Treg两种类型的细胞
图C 根据差异基因看两种Treg的功能,Treg-CTLA4高表达与Treg激活相关的基因包括LAYN,CCR8和TIGIT。Treg-IL10高度表达的肠道驻留Treg标志物,包括IL10,IL23R和IL1R1(Treg-IL10 highly expressed gut-resident Treg markers, including IL10, IL23R, and IL1R1)。
第一个好理解,Treg细胞原本是机体用来维持免疫耐受的亚群,在很多重要的体内脏器周围,这些免疫抑制的细胞能够有效避免过度激活的T细胞对于这些器官的伤害。但肿瘤中Treg-CTLA4高表达与Treg激活相关基因则抑制T细胞对肿瘤的杀伤。第二个的原因暂时不太懂。
据仅有的知识可知,图C是通过细胞中表达的基因验证了他们对Treg的分类
图D,CRLM患者Pri.CT中Treg-IL10和Treg-CTLA4的比例显着增加,表明具有Liv.Mets的原发性CRC肿瘤可能表现出更强的免疫抑制。
图E,F,G,H,I都是为了解释这4种M-type的来源,首先,图E,F显示Treg-CTLA4中的TCR显示Pri.CT和Liv.Mets之间的显着共享,但Treg-IL10的TCR在Pri.CT和Liv.Mets之间表现出相互排斥的模式。(主图中没显示的是Th17互斥,Th1共享)
图I 显示了从Treg-FOXP3到Treg-CTLA4的过渡方向,表明血液中静止的Tregs可能迁移到两个肿瘤部位,然后在TME中被激活和扩增
因此,有两种机制存在于CD4 T细胞中:Th17和Treg-IL10是由具有不同来源的肿瘤细胞招募的,Treg-CTLA4和Th1样起源于相同的前体。
总结:主图关注于M-type的细胞,通过他们高表达基因来解释他们在肿瘤微环境中的作用,进而证明了被分类为M-type(与肿瘤相关的细胞类型)的原因,并解释了这些细胞各自是如何到达原发灶和转移灶微环境的(同源或是被不同癌细胞分别招募)。
fig5研究的组分:肿瘤相关巨噬细胞(TAM)
总的来说,三群分别高表达SPP1,C1QC和MKI67的肿瘤相关巨噬细胞(TAM)是M-type (图A ),SPP1+ TAM主要发挥促血管生成和促进肿瘤转移的功能(图G),且其特征基因和更差的预后相关(图E,F)。值得注意的是,研究人员发现SPP1+ TAM不存在于原发肝癌中,却在结直肠癌的肝转移位点显著富集。对淋巴结位点的分析也发现,SPP1+ TAM只在淋巴结转移的患者中被识别到,提示SPP1+ TAM会促进CRC癌细胞的转移(图B,C,D)
使用的公开数据:
图D :GSE14297
图E,F : TCGA、COAD 和 READ
fig6研究的组分:DC
图A ROGUE指数计算了它们的纯度,cDC2 作为一个整体,表现出最高的异质性,而每个 cDC2 子集都显示出更高的 ROGUE 指数,因此被假定为纯集群,后续研究其中的细胞类型。
图C,D 基于差异表达分析,cDC2-C1QC表现出更高的C1QA,CD68,CD163和CD14表达,类似于最近在人类和小鼠队列中发现的DC3群体,因此被定义为DC3s.
cDC2-TIMP1高度表达maturation markers如CCR7以及血管生成相关基因,包括EREG,CREM和VEGFA
因此,这两个cDC2亚群的表型不同,DC3显示出更高的"促炎"特征,cDC2-TIMP1表达更多的"抗炎"基因(图E)
图F 显示非转移性HCC,CRC和CRLM数据中DC亚群的相应细胞类型
图G 与Liv.Mets和非转移性CRC肿瘤相比,DC3s在CRLM的Pri.CT中显示出更高的频率。
公开数据验证:
根据对TCGA,COAD和READ队列的生存分析,cDC2s中DC3s的比例与预后不良有关(图H )。这样的观察结果得到了另一个队列(GEO:GSE39583)的证实(图I)
从本文学到的东西:
1.学习方法流程的资源
STAR☆Methods是cell规定的方法写作标准,登录cell和其部分子刊,非常便于方法的学习。
1其他方法的渠道是
1包含许多软件流程统计学方法。
2.本文取样和设计的思路,以及写方法对做文章的作用。
本文最主要核心就是设计了一个分类的方法,之后都是根据这个分类去验证。因此凸显了写方法对做文章的重要意义。