Nat Commun:乳腺癌单细胞测序深度解析
小伙伴们好呀!今天科研菌要和大家分享的是2017年发表在Nature Communication(IF:11.88)的一篇文章,“Single-cell RNA-seq enables comprehensive tumour and immune cell profiling in primary breast cancer” ,文章利用单细胞测序技术(scRNA-seq)揭示了原发乳腺癌病人癌组织中肿瘤细胞和肿瘤浸润免疫细胞的基因表达谱,从这两类细胞去分析乳腺癌的异质性,为针对乳腺癌的分子靶向疗法提供了理论基础。
Single-cell RNA-seq enables comprehensive tumour and immune cell profiling in primary breast cancer
利用scRNA-seq揭示原发乳腺癌中肿瘤细胞和肿瘤浸润免疫细胞单细胞水平的基因表达谱
一.研究背景
自从内分泌疗法应用于ER阳性的乳腺癌(Breast cance,BC)患者以来,研究者已经评估了很多针对BC的分子靶向疗法。然而BC基因组和基因表达谱的分析都是通过对肿瘤组织整体的研究得来的,因肿瘤自身的异质性,分子靶向治疗的效果大大折扣。其中BC的遗传异质性(拷贝数变异,单核苷酸突变等)以及癌细胞基因表达水平的异质性对疗效有很大影响。此外,因为肿瘤微环境中各种细胞的存在,从癌组织整体得到的基因表达谱中也反映了非肿瘤细胞的特征,也对癌症的分子靶向治疗造成了干扰。而且这些肿瘤微环境中的细胞自身的基因表达特征也存在独立的预后价值,值得去探究。
以上这些观点体现了根据癌组织基因表达谱进行分子靶向疗法的缺点和局限。而作者希望通过对不同分子类型的乳腺癌的单细胞水平上的研究,去揭示不同BC亚型中癌细胞和肿瘤微环境中非癌细胞的基因表达特征,从而为不同亚型BC的分子靶向治疗提供理论依据。同时作者希望通过对肿瘤微环境中免疫细胞的研究,从免疫细胞转录组水平揭示癌症免疫逃逸的机制。
二.论证逻辑
三. 结果解析
1. 得到11个样本的外显子数据
11个乳腺癌病人的基本信息如下表,获取全部病人的肿瘤组织以及BC03,07的转移淋巴结组织进行WES(全外显子测序,数据在SRP067248),bulk RNA-seq(即对样本组织整体进行RNA-seq)以及scRNA-seq(数据在GSE75688)
乳腺癌的分子亚型分子标志样本备注
Luminal AER+/PR+,HER2-BC01-02-
Luminal BER+/PR+,HER2+BC03经过赫赛汀治疗
HER2过表达型ER-,PR-,HER2+BC04-05-06-
basal-like型/三阴性ER-,PR-,HER2-BC07-08-09-10-11-
⬅向左拖拽可滑动
表1. 样本信息
分析WES数据得到的11个BC患者发生显著突变的基因的的CNV(拷贝数变异)和SNV(单核苷酸突变)信息。BC特征基因的突变也被发现,包括PIK3CA,TP53,ERBB2等基因。在TNBC患者中发现CNV有明显改变
图. 1 样本WES得到乳腺癌相关基因的CNV和SNV信息
2. 得到11个样本的scRNA-seq数据
作者用的是microfluidic chips捕获单细胞,用SMARTer Ultra Low RNA Kit建库,Hiseq-2500测序。STAR用于把reads与标准序列对照,基因reads归一化为TPM(使用RSEM),RNA-SeQC对RNA-seq数据进行质量控制,过滤标准如下:
细胞基因
1. number of total reads1. 样本中TPM<1的基因直接用0替代
2. mapping rate2. 转换为log2(TPM+1)
3. number of detected genes3. 在<10%的肿瘤组织细胞中表达的基因被除去
4. portion of intergenic region-
⬅向左拖拽可滑动
表2. scRNA-seq质量控制步骤
经过滤后留下了包含515个细胞和17779个基因的scRNAs-seq数据用于后续分析,在这之前先检验数据的可靠性。每个scRNA-seq数据中两个RNA-spike in的表达比率恒定(A),与特定基因的qRT-PCR结果相关性高(B);将每个样本的scRNA-seq数据合并后与其bulk RNA-seq数据间相关性高(C-D);对每个样本随机抽取一定细胞进行多元回归分析,随着细胞数增多,对bulk RNA-seq解释的方差也增高(E)。这些都说明作者得到的scRNA-seq数据是可靠的,可以很好的代表肿瘤群体
图. 2 检测scRNA-seq数据是否真实可靠
3.分离单细胞群中的肿瘤细胞和非肿瘤细胞
首先是确认BC中广泛的异质性
A:通过PCA法对数据降维,发现不同样本的细胞和属于同一样本的细胞混合在一起,说明BC异质性同时存在于肿瘤间和肿瘤内
B:三个治疗靶点基因ER,PR,HER2在不同分子亚型BC样本中以及同一分子亚型BC样本的细胞中的表达也存在异质性。比如在TNBC样本的细胞中也存在高表达HER2的细胞
C-D:通过每个样品的病理切片检查发现肿瘤组织中存在不同程度的免疫细胞浸润以及其他类型细胞
图4. BC间存在广泛的异质性
因为在进行scRNA-seq前细胞并未筛选,所以作者认为肿瘤组织中的非肿瘤细胞可能造成了BC的异质性,下一步是要对其进行分离,再分别分析
A:先通过细胞CNV信息分离开肿瘤细胞和非肿瘤细胞,再根据免疫评分区分免疫细胞和基质细胞
B:作者打算根据单细胞基因组的染色体表达模式即CNV模式,从已知的乳腺癌的基因组CNV去推断细胞是否为癌细胞。作者用GTEx数据库中正常乳腺组织的基因表达谱做为对照,根据基因的所在的染色体以及起始位置进行排序,以150个基因步长移动计算每个细胞的CNV模式并归一化。之后通过对515个细胞的无监督聚类得到11种类别,可以看到靠上的细胞群都属于某种BC亚型且都有独特的CNV模式;而最下方的一类细胞群并不属于某种BC亚型且没有明显的CNV模式
图5. 细胞的CNV模式
为了验证从scRNA-seq得来的细胞基因组CNV信息的可靠性,需要和WES得到的CNV信息进行比对,从而验证根据细胞CNV模式进行分类的可靠性
A:以样本BC01的scRNA-seq数据得到的CNV信息为例,可以看到它和WES得到的CNV信息有很高的一致性
B:对各个样品中由scRNA-seq数据得来的有CNV的基因表达量取平均值与各样本WES得来的相应基因表达量进行相关性分析,在大多数样本中呈现高度正相关
图6. 从scRNA-seq和WES数据中推断的CNVs的相关性
C:根据图6. B中的聚类结果,给每个细胞加上癌细胞或非癌细胞标签,此时PCA图中两大类细胞是明显分开了的,说明分类较成功,结果可信
D:用ESTIMATE包对两类细胞进行分析,绿色数据为GTEx数据库中183个正常乳房组织的分析结果。由上文得到的肿瘤细胞的肿瘤得分很高而免疫和基质得分与非癌细胞相比显著降低。有趣的是,在非肿瘤细胞中有一些细胞的免疫得分很低,被认为是纤维母细胞等基质细胞
E:作者观察了两类细胞分别在3个免疫相关基因,3个机制相关基因和3个肿瘤相关基因的表达情况(顺序从下到上)。肿瘤细胞高表达肿瘤相关基因;非肿瘤细胞高表达免疫相关基因;非肿瘤细胞中也存在高表达基质相关基因的细胞
通过以上方法,作者从515个细胞中分离出了317个肿瘤细胞,175个肿瘤相关免疫细胞以及23个基质细胞用于后续下游分析
图7. 成功分离了癌细胞与非癌细胞
4. 乳腺癌细胞内在的异质性
在成功区分两类细胞后,就能分别展开研究
A:在去除非癌细胞后,样本单个肿瘤细胞间的相关性显著增加,说明肿瘤内在的异质性可以从单细胞水平去解释。也可以看到TNBC样本细胞间的相关性并没有明显提高,说明其肿瘤细胞间也存在较大差异
B:用箱线图的形式展示去除非癌细胞之前(白框)和之后(条纹框)的肿瘤内细胞的相关系数。从最右侧的条形图可以看出在TNBC(粉色)内无论是否去除非肿瘤细胞,其样本内细胞间相关性始终不高,说明肿瘤细胞和微环境中的非肿瘤细胞都对TNBC的异质性有影响
C:分别对肿瘤细胞(左)和非肿瘤细胞(右)进行PCA分析。属于不同BC样本的肿瘤细胞会聚成自己独立的类(左侧),也有些样本的肿瘤细胞混合在一起,说明了不同类型BC间和同一类型BC内肿瘤细胞间的异质性;而对于非肿瘤细胞而言(右侧),不同样本的细胞混合在一起,说明样本BC类型对细胞聚类的影响很小,而非肿瘤细胞的类型对聚类的影响更大
图8. 去除非癌细胞后揭示了BC细胞内在的异质性
接下来对分离出的肿瘤细胞进行BC分子亚型的分类,由于样本BC05接受过化疗,所以并不将其包含在内
A:将肿瘤细胞根据HER2 module score和ER module score(利用genefu包)分成ER+/HER2-,HER2+和ER-/HER2-三类,右侧热图展示每个样本中肿瘤细胞的得分情况,与样本所属的BC分子亚型基本一致,但一些样本混合了其它亚型的细胞。下方饼图展示了每个样本中各种类型细胞所占的比例,像BC04-06的细胞显示出混合的亚型,尤其是BC06中大多数肿瘤细胞属于TNBC型;而属于Luminal B型(ER/HER2双阳)的BC03中的肿瘤细胞却被归为HER2阴性的细胞。这说明不同分子分型BC的肿瘤细胞内在的异质性
B:GSVA包( Gene Set Variation Analysis,通过评估基因集在样本转录组中表现看某一通路是否激活)分析了EMT,干性,血管新生,增殖和复发(从genefu包中得到基因集)通路在每个细胞中的富集程度。可以看到EMT基因集在TNBC样本中富集程度更高;HER2型和TNBC型样本中干性和复发相关基因集富集程度更高(下方箱线图)。EMT,干性和血管新生的富集分数在肿瘤细胞中呈现显著正相关(上方散点图),并以5%为阈值鉴定出三者分数都很高的稀有细胞(散点图右上角标出),它们可能在BC的发生发展中起重要作用
图9. BC细胞内在的异质性
5. BC分子亚型间的异质性成分
A:利用Seurat包中的LRT检验法获得了4种BC分子亚型样本的单细胞水平的差异表达基因(左侧),右侧是bulk RNA-seq中样本间的差异表达基因,下方是不同样本单细胞水平GSVA分析的结果
B:分析BC03-04-06三个样本(HER2+)肿瘤细胞中HER2/HER3及其下游信号通路激活情况
C:针对TNBC样本的分析(BC07-BC11),在A中可以看出样本细胞差异表达基因在basal通路富集。然而根据之前研究报道,还可以将TNBC样本肿瘤细胞分为6种不同类型(右侧图例)。分类后发现每个TNBC样本的肿瘤细胞中存在多种类型细胞,这也解释了TNBC广泛的异质性
图10. 不同BC亚型的单细胞水平基因表达谱
6. 肿瘤浸润免疫细胞的异质性
结果4.5是对BC样本中肿瘤细胞的分析,接下来作者分析了肿瘤微环境中的免疫细胞
A:作者先用NMF法将175个免疫细胞根据免疫基因集聚成了三类,注释为B细胞,T细胞和巨噬细胞。同样用LRT法找出三个类中的差异表达基因(左上)。右侧是三个类别细胞中差异基因的GO分析结果。作者同样对所有免疫细胞做了GSVA分析(右下),可以看到第一类(B细胞)中的细胞大部分来自BC转移淋巴结组织;其他两类大部分来自原位BC组织
B:针对第一类B细胞,作者对它们根据在各个基因集中的GSVA的富集分数进行层次聚类画热图,这些B细胞又被分为两类。其中一种有初始B细胞的特征,多来自TNBC样本;另一种具有中心细胞或中心母细胞的特征,大多来自BC03的转移淋巴结组织
图11. 对肿瘤微环境中免疫细胞的分析
B-C:利用免疫荧光技术检测样本BC组织中的免疫细胞,CD3是T细胞的标志分子,CD20是B细胞的标志分子。C中点代表样本,颜色越深表示捕获到的单细胞中的相应免疫细胞数越多,横坐标是相应标志分子在bulk RNA-seq中的表达量,纵坐标是免疫萤光标记的细胞数。可以看到免疫荧光的结果和bulk RNA-seq的结果呈显著的正相关(p<0.05),而且scRNA-seq确实可以得到T,B淋巴细胞的基因表达谱(灰/黑色点),但并不是所有样本的scRNA-seq都可以(白点)
图12. 免疫荧光技术验证淋巴细胞的存在
7. 对肿瘤浸润的T细胞和巨噬细胞进行分析
将免疫细胞中的T细胞提取出,根据细胞的在每个基因集中的GSVA富集分数进行聚类分析,它们又被聚成4种类型T细胞,分别表现出初始T,共刺激T,调节T和耗竭性T细胞的基因表达特征。之后分别对各样本BC组织中免疫细胞的组成进行分析。并得出BC样本中免疫细胞具有表达免疫抑制基因的特征的结论
图13. 肿瘤微环境中T细胞的特征
好啦,让我们总结一下本文。作者收集了4种分子亚型的BC样本组织,主要是通过scRNA-seq数据研究乳腺癌的异质性。在对RNA-seq数据质量检验后根据细胞的CNV表达模式将细胞分为肿瘤细胞和非肿瘤细胞(多为免疫细胞)后分开研究乳腺癌的异质性。本文主要利用genefu包对肿瘤细胞进行分子分型,以及GSVA包开展功能分析。让我们期待下一次的文献解读,大家不见不散!
还是和往常一样,后台回复「2b」,即可获取今天小编为大家解读的文献哦!
▼▼是否遗漏了往期精彩生信解析没看呢?▼▼
汇总贴
生信思路
m6A热点
2.即将11+分的JHO:泛肿瘤中m6A和5mC与肿瘤免疫特征
肿瘤免疫微环境
单细胞测序
1.在Aging上发表的胃癌单细胞测序做了什么?
特定基因表达谱预后
2. 肾癌EMT基因预后标志物发5+分
3. 纯生信自噬基因与乳腺癌预后也能发5分!
4. Genome Med一文带你学会胚系突变与泛癌预后思路
干湿结合
ceRNA
基因组
表观遗传
生信杂志
1. 被“灌水”的Aging(IF=5.515)还能不能投??
4. 即将突破5分的Frontiers in Oncology是灌水杂志吗?
5. 博士毕业神器3+分纯生信杂志:平均一审只要一个月,年刊量1000+
无需转发/分享の精品资源
2.无需转发!免费送你全套53本九版教材+习题集+八年制教材
科研菌始终都在,陪你度过漫漫科研路
希望志同道合的小伙伴就像科研“菌”一样不断裂变,越来越多
▲ 长按二维码“识别”关注设置为星标关注科研菌回复"1"即可获取"28G全网最全科研绘图素材"、"谷歌上网助手"(梯子)和"科研常用软件合集"、“肿瘤/消化内科指南”、"考研复试大礼包"(无需转发/集赞)