TcellExTRECT 利用全外显子测序(WES)评估肿瘤免疫
TcellExTRECT应用场景
肿瘤组织的免疫微环境影响肿瘤进化,可以预测肿瘤对于免疫疗法的反应性以及治疗预后。免疫检查点抑制剂治疗已经成功的应用到肿瘤免疫治疗中。但大多数肿瘤患者对于免疫检查点抑制剂反应性较弱。免疫检查点抑制剂的效应主要由T细胞识别肿瘤相关抗原介导。
伦敦大学近期在Nature 上发表题为Using DNA sequencing data to quantify T cell fraction and therapy response 的文章提出用一种用WES数据进行肿瘤T细胞定量的方法:基于TCR V(D)J重排和T细胞受体切除环 (T cell receptor excision circle,TREC) 丢失来对T细胞进行定量。作者首先分析了WES中依赖于测序深度的肿瘤体细胞拷贝数变异(cancer somatic copy number alteration,SCNA),发现在TCRA中检测到的SCNA反映了T细胞的含量,而不是肿瘤的SCNA。为了利用此信号来量化T细胞含量,作者开发出了T cell exome TREC tool (T cell ExTRECT)系统。能够得出样本中T细胞的评分。
文章链接:Using DNA sequencing data to quantify T cell fraction and therapy response | Nature
软件链接:GitHub - McGranahanLab/TcellExTRECT
软件安装
方法一:从github上在线安装
# install.packages('devtools')
library(devtools)
install_github("McGranahanLab/TcellExTRECT")
library(TcellExTRECT)
注:该软件依赖很多其他包,需要提前安装。安装的过程可能会遇到各种库文件的缺失,小编总结了在此软件安装时主要遇到的两类库文件缺失的解决方案,见安装R包 fatal error: zlib.h: No such file or directory 问题解决 - 简书 (jianshu.com)和安装R包 x86_64-conda_cos6-linux-gnu/bin/ld: cannot find -lxxx 问题解决 - 简书 (jianshu.com)
方法二:从github上下载源码后安装
install.packages('PATH/To/TcellExTRECT/', repos=NULL, type ='source')
library(TcellExTRECT)
软件使用
1. 分析前准备
a.该软件仅对TCR区域进行了分析,所以需要先获取所使用基因组上TCR区域的位置。TcellExTRECT软件已经提前配置好了hg19和hg38对应的位置信息,只需要加载就行
#hg19
data("tcra_seg_hg19")
#hg38
data("tcra_seg_hg38")
b.获取全外panel在TCR区域捕获的exon区间
如果你的panel是Agilent(v4/5)或者Nimblegen的可以直接加载软件预配置的文件
data("TCRA_exons_hg19")
#or
data("TCRA_exons_hg38")
#or
data("TCRA_exons_nimblegen_hg19")
#or
data("TCRA_exons_nimblegen_hg38")
如果你用的非上述panel,也可以用bed文件来构建你自己的TCR区exon捕获区间
bed.file <- PATH_TO_BED
TCRA_exons_hg19_custom <- createExonDFBed(bed.file, 'hg19')
注:如果你用的panel不是TcellExTRECT官方支持的,可能会因exon覆盖度不够而引起结果的偏差
c.bam文件
软件的输入是bam文件,需要提前准备好
d.Samtools (>v1.3.1)
软件可直接调用samtools软件计算TCR区的reads覆盖深度,所以需要提前把samtools安装好。当然你也可以用其他软件提前计算TCR区reads覆盖深度,并整理成TcellExTRECT所需的格式。
2. 软件使用说明
a. 计算TCR区深度计算
example_bam <- '/path/to/file.bam'
cov.file <- getCovFromBam(
bamPath = example_bam,
outPath = '',
vdj.seg = tcra_seg_hg19)
cov_df <- loadCov(cov.file)
b.T cell fractions计算
TCRA.out <- runTcellExTRECT(cov_df, TCRA_exons_hg19, tcra_seg_hg19, 'hg19')
write.table(TCRA.out ,"/TcellExTRECT/result/output/filename.xls",sep="\t",quote=F,row.names=F,col.names=T)
结果示例:
image.png
其中:
sample :样本名
TCRA.tcell.fraction :T cells 占比
TCRA.tcell.fraction.lwr/TCRA.tcell.fraction.upr :T cells 占比的95%置信区间
qcFit :用来描述用于估计T细胞分数的GAM模型拟合中噪声的,最小值为1,表示信号清晰且噪声小。如果该值为>4,将输出警告消息
c.Log2 Read Depth Ratio可视化
pdf("/TcellExTRECT/result/plot/filename.pdf",width=8,height=8)
plotTcellExTRECT(cov_example, TCRA_exons_hg19, tcra_seg_hg19,'hg19', sample_name = 'TEST')
dev.off()
结果示例:
image.png
d.用肿瘤纯度和TCR区拷贝数进行校正
可以用肿瘤纯度和TCR区拷贝数信息对T cell fractions进行校正
TCRA.adjust <- adjustTcellExTRECT(TCRA.out, purity = 0.5, TCRA.cn = 3)
write.table(TCRA.adjust ,"/TcellExTRECT/result/output/filename.adjust.xls",sep="\t",quote=F,row.names=F,col.names=T)
软件评价
优势
1.可利用WES进行肿瘤T细胞定量,填补了该领域的空白;
2.T cell ExTRECT不依赖于样本是否新鲜以及处理方式,因此该方法可以应用于任何WES样本,可以分析肿瘤和血液样本中的T细胞。
不足
对于非T cell ExTRECT官方推荐的全外panel不够友好,可能会引起偏差;市面上很多商业化的全外panel(例如某些公司~30M的panel)在TCR区的覆盖度不够,无法进行分析
打包
args = commandArgs(T)
if (length(args) !=5){
print("Rscript this R <bam> <bed> <hg19 or hg38> <ourdir> <pre_outfile>")
q()
}
library(TcellExTRECT)
data("tcra_seg_hg19")
bam.file<-args[1]
bed.file<-args[2]
TCRA_exons_hg19 <- createExonDFBed(bed.file, args[3])
cov.file <- getCovFromBam(bamPath = bam.file,outPath = args[4],vdj.seg = tcra_seg_hg19)
cov_df <- loadCov(cov.file)
TCRA.out <- runTcellExTRECT(cov_df, TCRA_exons_hg19, tcra_seg_hg19, args[3])
write.table(TCRA.out,paste(args[4],"/",args[5],"_T.cell.fractions.xls",sep=""),sep="\t",quote=F,row.names=F,col.names=T)
pdf(paste(args[4],"/",args[5],".Log2.Read.Depth.Ratio.pdf",sep=""),width=8,height=8)
plotTcellExTRECT(cov_df, TCRA_exons_hg19,tcra_seg_hg19,args[3], sample_name = args[5])
dev.off()
运行示例
/*/Rscript TcellExTRECT.r /*/*.bam /*/V6_bed/V6.covered.bed hg19 /*/TcellExTRECT/0_test 21