estimate 包所有函数超详细解读及计算免疫浸润评分
2021-02-07 本文已影响0人
灵活胖子的进步之路
estimate包可以通过RNA-seq的数据来计算标本的免疫及机制评分,进而评估肿瘤的纯度,其原理通过特征的肿瘤的RNA-seq的signture来评估以上内容,其输入文件需要的为RNA-seq的矩阵,内在还是需要common_genes-data来计算。以下详细解读这个包的常用函数的用法并计算评分
首先按照包
install.packages("estimate", repos="http://R-Forge.R-project.org")
library(estimate)
首先应用自带的内在数据集
OvarianCancerExpr <- system.file("extdata", "sample_input.txt", package="estimate")
read.table(OvarianCancerExpr)[1:4,1:4]
![](https://img.haomeiwen.com/i22546862/87730f75a76647aa.png)
下面我们应用filterCommonGenes这个函数来取我们自己的表达矩阵与作者gene data set 的交集
filterCommonGenes(input.f=OvarianCancerExpr,#输入文件,为自己的表达矩阵
output.f="OV_10412genes.gct",#定义输出到工作目录的输出文件名,后缀为gct
id="GeneSymbol")#我们数据集的列名为GeneSymbol,因此这里选择拿GeneSymbol进行匹配
以下我们看下生成的OV_10412genes.gct文件
rt<-read.table("OV_10412genes.gct",
skip = 2,
header = TRUE,
sep = "\t")
View(rt)
![](https://img.haomeiwen.com/i22546862/3301b04b14b0a0d0.png)
![](https://img.haomeiwen.com/i22546862/2f84e12044eb97b5.png)
estimate包内其实包含了内置的共有基因的数据集,名称为common_genes,以下我们来看下
data("common_genes")
View(common_genes)
![](https://img.haomeiwen.com/i22546862/394aa22edc8d1932.png)
从这个数据集可以看出,在filterCommonGenes函数中参数id我们还可以选择EntrezID
之后estimateScore函数计算各种免疫及基质评分
estimateScore(input.ds = "OV_10412genes.gct", #刚才过滤得到的输入文件
output.ds="estimateScore.gct", #输出的输出文件
platform="affymetrix") #注意平台,如果为TCGA或者测序数据则选择illumina
这是这个包的主要函数,下图为改函数的用法
![](https://img.haomeiwen.com/i22546862/6b9d7fd293bc72a1.png)
以下整理数据的格式
![](https://img.haomeiwen.com/i22546862/dba8fa4336ea8c3a.png)
scores=read.table("estimateScore.gct",#读取文件
skip = 2,#删除前2行
header = T)#第一行为列名
View(scores)
![](https://img.haomeiwen.com/i22546862/34dd658c34dbfa18.png)
rownames(scores)=scores[,1]#取第一列为行名
scores=t(scores[,3:ncol(scores)])#取3列到最后1列的数据并进行数据转置
View(scores)
![](https://img.haomeiwen.com/i22546862/92519d8308653e5d.png)