TCGA基因表达数据和生存数据合并

2021-08-11  本文已影响0人  萍智医信

打开临床数据excel,分别自定义排序futime和fustat,futime中去掉生存天数为0和没有的数据,fustat中去掉无生存状态的数据(1为死亡,0为存活)


临床数据整理最终结果.png

将上图数据全部复制粘贴到新建time.txt文件中


time.txt.png
输入文件lncrnaPair.txt.png
library(limma)                #引用包
pairFile="lncrnaPair.txt"     #免疫lncRNA对文件
cliFile="time.txt"            #生存数据文件
setwd("E:\\Master research")    #设置工作目录

#读取表达文件,并对输入文件整理
rt=read.table(pairFile, header=T, sep="\t", check.names=F)
rt=as.matrix(rt)
rownames(rt)=rt[,1]
exp=rt[,2:ncol(rt)]
dimnames=list(rownames(exp), colnames(exp))
data=matrix(as.numeric(as.matrix(exp)), nrow=nrow(exp), dimnames=dimnames)
data=avereps(data)

#删掉正常样品
group=sapply(strsplit(colnames(data),"\\-"),"[",4)
group=sapply(strsplit(group,""),"[",1)
group=gsub("2","1",group)
data=data[,group==0]
colnames(data)=gsub("(.*?)\\-(.*?)\\-(.*?)\\-(.*?)\\-.*", "\\1\\-\\2\\-\\3", colnames(data))
data=t(data)
data=avereps(data)

#读取生存数据
cli=read.table(cliFile,sep="\t",check.names=F,header=T,row.names=1)     #读取临床文件

#数据合并并输出结果
sameSample=intersect(row.names(data),row.names(cli))
data=data[sameSample,]
cli=cli[sameSample,]
out=cbind(cli,data)
out=cbind(id=row.names(out),out)
write.table(out,file="pairTime.txt",sep="\t",row.names=F,quote=F)
输出文件.png
上一篇下一篇

猜你喜欢

热点阅读