生物信息学与算法单细胞测序分析scRNA-seq

Day4-单细胞转录组探索癌症免疫治疗获得性抗性机理

2019-05-03  本文已影响22人  刘小泽

刘小泽写于19.5.2
这一篇是免疫相关,美国Fred Hutchinson癌症研究中心于2018年9月发表在NC的Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA,本文的重点在于单细胞数据的分析部分

由于是第一次接触免疫相关,因此相关的背景知识需要列一下

背景知识

(图片来自文章:Role of MHC-Linked Susceptibility Genes in the Pathogenesis of Human and Murine Lupus)

Class I基因编码的抗原受体几乎分布于整个细胞表面,作用是呈递内源性抗原;

Class II编码的白细胞抗原只有在吞噬细胞(如巨噬细胞、B细胞)的表面存在,作用是呈递外源性抗原;

Class III 编码的产物主要参与补体系统 的调节

Class I、II基因参与免疫调节,因此它们的等位基因是研究热点(I类主要看A、B、C基因;II类主要是DR、DQ、DP基因)

研究背景

癌症免疫治疗在临床上前景巨大,但是目前有许多使用这种技术的患者后来出现复发的状况。

本文团队在研究Merkel细胞时发现,20%的患者对免疫治疗有初步反应,但后来存在复发的情况,预后不理想。为了提高预后,理解后期/获得性免疫治疗耐受性的机理是有必要的。利用细胞免疫治疗临床试验,可以表征T细胞《=》抗原的相互作用,进而了解复杂的肿瘤细胞-免疫细胞之间的关系,并且为避免肿瘤复发应采取何种免疫联合疗法提供帮助。

研究方法

大体思路就是:癌症患者免疫治疗=》发现抗性复发=》scRNA-Seq=》研究获得性抗性机理

最初采用联合疗法对两名Merkel患者进行治疗,发现肿瘤逐渐缩小,他们出现的显著的肿瘤消退都与活化的CD8+T细胞浸润到消退的肿瘤组织有关。

这两例患者分别为:

取了患者的血液和肿瘤,做了免疫组化、分选、外显子测序、10X scRNA-Seq、qPCR

外显子测序

两个患者2586-4 (discovery) and 9245-3 (validation),从外周血单核细胞(peripheral blood mononuclear cell,PBMC)中分离DNA作为germline对照,然后取出肿瘤免疫治疗前以及获得性抗性的样本。

患者2586-4采用Agilent SureSelect Human All Exon V6 芯片+HiSeq 2500,annovar比对hg19,MuTect检测somatic突变;

患者9245-3采用xGen建库+Hiseq4000(100X),BWA比对到hg19,GATK call variants

单细胞测序[重头戏]

1-- 原始数据

患者2586-4:利用10X 3' Chromium v2.0平台建库 + Hiseq2500 "rapid run"模式;

GSE117988

ID                  Description

GSM3330559  Tumor Disc Pre
GSM3330560  Tumor Disc AR

GSM3330561  PBMC Pre
GSM3330562  PBMC Disc Early
GSM3330563  PBMC Disc Resp
GSM3330564  PBMC Disc AR

患者9245-3:利用10X 5' V(D)J 进行cell washing, barcoding and library prep+ NovaSeq 6000(gene expression) + Hiseq4000 (V(D)J)

GSE118056

ID                  Description

GSM3317833  PBMC Relapse - L001
GSM3317834  PBMC Relapse - L002
GSM3317835  Tumor Relapse - L001
GSM3317836  Tumor Relapse - L002
2-- Transcriptome alignment, barcode assignment and UMI counting

患者2586-4(discovery) 利用Cell Ranger v2.0.0, 9245-3 (validation)利用Cell Ranger v2.1.0,进行sample demultiplexing, barcode processing and single-cell gene counting。

首先,利用mkfastq流程将原始的BCL文件转为fastq;然后,利用count流程整合了STAR将每个fastq与hg38和Merkel cell polyomavirus序列(HM011556.1)比对,比对后的reads根据cell barcode以及UMIs进行过滤

Cell barcodes with 1-Hamming-distance from a list of known barcodes were considered;
UMIs with sequencing quality score >10% and not homopolymers were retained.

接着利用aggr流程将Tumor与PBMC样本整合,生成两个gene-barcode表达矩阵(tumor和PBMC的),同时进行了测序深度的校正

3-- Data normalization and correction

根据这篇文献的方法:Miller, N. J. et al. Tumor-infiltrating Merkel cell polyomavirus-specific T cells are diverse and associated with improved patient survival. Cancer Immunol. Res 5, 137–147 (2017).

利用Seurat包中的ScaleData 函数进行校正和标准化:

corrected-normalized gene-barcode matrix 文件将作为下游降维、聚类的输入文件;

normalized gene-cell barcode matrix文件将进行MAST analysis

4-- Gene expression analysis: discovery patient tumor

过滤得到了7431 tumor cells (2243 cells before and 5188 cells after
T cell therapy),然后利用corrected-normalized gene-barcode matrix进行PCA、tSNE

首先,利用Seurat挑出了873个表达量变化最大的基因进行PCA

根据:log-mean expression values > 0.0125 and dispersion
(variance/mean) >0.5

接着,挑出前10个PCs进行tSNE

One thousand iterations of tSNE using a perplexity value of 30 were performed

然后利用MCC tumor markers(NCAM1, ENO2, CHGA and KRT20 and TILs)细胞分群、聚类,得到T细胞免疫治疗前的1984个癌细胞和治疗后获得抗性的5131个细胞;

又利用MAST的R包对前后的细胞进行差异分析,利用的是normalized gene-cell
barcode,其中利用了cellular detection rate (CDR) 作为协变量,校正可能影响细胞中检测到基因数的生物和技术偏差。差异基因定义为FDR为5%,fold change>1.3

5-- Gene expression analysis: discovery patient PBMC

PBMC涉及到了4个时间点:pre-treatment、early post treatment day+27、responding post treatment day +37、replace/acquired resistance post treatment day +64

过滤后总共得到12,874个细胞,也是利用corrected-normalized gene-barcode matrix进行PCA、tSNE分析。

首先,选择1203个变化最大的基因;
然后选10个PCs进行tSNE(同上);细胞聚类使用Seurat的FindCluster函数,得到13个不同的细胞群(参数:neighborhood size of 40 and resolution of 0.6),根据分群的结果,移除了三个在red blood cell and megakaryocyte markers中富集的cluster,总共剩下11,021个细胞;
之后利用FindMarkers函数根据marker的富集情况,给细胞群加标签,结果有9个不同的cluster:CD4+ T cells, CD8+ T cells, CD8+ effector T cells, B cells, NK cells, CD14+ monocytes, CD16+ monocytes, myeloid cells and dendritic cells;
CD8+与CD8+ effector T细胞的在第三个时间点(responding阶段)差异基因分析也是利用MAST。代码见Supplementary Data 3.

6--Gene expression analysis: validation patient

利用corrected-normalized gene-barcode matrix去做PCA、tSNE,方法同上=》19个不同的clusters。代码见Supplementary Data 4.

单细胞部分研究结果

重点关注单细胞部分,免疫原理部分这里不做深入研究。

先是PBMC细胞

首先是discovery(2586-4)患者PBMC在4个时间点鉴定的活化CD8+ T细胞分群:
对11021个细胞进行tSNE分析的分群结果显示:
代表性的marker基因如下:

(从b-i都是为了辅助细胞分群鉴定,蓝色表示基因表达,且颜色越深表达量越高)

另外根据4个先后时间点做出的细胞分群如下

其中响应免疫疗法的激活的CD8+淋巴细胞簇是箭头指的红色部分,将不同时间点的CD8+对比发现Day +376(response时间点)的CD8+细胞簇最多

继续将Day +376(response时间点)的red activated cluster (n =170) 与 blue effector/EM cluster (n = 429) 进行差异分析,得到45个差异基因,热图展示一部分:

接下来是肿瘤组织,时间点和PBMC不同,它只有两个治疗前的原位癌pre-treatment、复发癌 late relapse/acquired resistance

首先可以看到的是,这个组织中肿瘤细胞占比较大,并且治疗前后分的还是很开的,意味着治疗前(蓝色)与复发后(橘色)差别还是很大的,为了看这个差异是由哪些基因导致的,又做了差异分析+热图,得到255个差异基因

其中箭头标出的位置是HLA-B,它在复发瘤中表达量降低,那么下降的趋势如何呢?

发现与HLA-A相比,MCC在获得性抗性中显著下调HLA-B

之后在另一个患者那里进行验证(11267个细胞):也发现类似的情况,只不过是HLA-A表达量降低

讨论

晚期/获得性免疫抗性是免疫治疗治愈的障碍,本文对两名接受T细胞免疫治疗与ICI的患者,他们都有持续的免疫治疗反应,之后是抗性产生。观察到CD8+ T细胞浸润到萎缩的MCC肿瘤中,支持T细胞介导的消退,当肿瘤复发的时候,存在着明显的选择性转录下调HLA

肿瘤能够通过沉默能够被T细胞识别的蛋白的编码基因进而实现肿瘤的免疫躲避。HLA的三组基因通常全部同时关闭或打开,HLA三组基因只要其中一个被关闭,那么肿瘤细胞就能逃避T细胞

单个或所有的I类HLAs基因缺失导致的免疫逃避被描述为对细胞免疫治疗产生细胞免疫抗性机制和抗pd -1检查点抑制剂机制。第I类基因座的转录抑制也许也是其他免疫治疗产生耐药性的原因(包括免疫检查点治疗),这项发现将为设计新型免疫治疗手段带来积极影响。


欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!
上一篇 下一篇

猜你喜欢

热点阅读