数据下载-单细胞转录组分析数据下载和整理scRNA-01

2023-08-29  本文已影响0人  一车小面包人

背景:单细胞转录组常规分析流程,01是单细胞转录组数据的下载和整理

那么,我们编写R脚本保存这些样本信息:

my.dir="" #'绝对路径 /home/***/04.workflow/05.scRNA_linsr/GSE149655_RAW/
samples=list.files(my.dir, full.names=F, recursive=F) #'路径下的以样本名命名的文件夹
dirs=paste0(my.dir,samples) #'样本名命名文件夹的完整路径
groups=gsub("[^a-zA-Z]","",samples)
meta.data<-data.frame(samples=samples,dirs=dirs,groups=groups)
colnames(meta.data)<-c("orig.ident","dirs","groups")
sub.meta.data<-meta.data[,c("orig.ident","groups")]

得到文件路径与样本批次信息:

samples_info.png
承接上面的脚本,继续整理每个批次的counts矩阵,合并为sc.merge.rds并保存:
datalist<-lapply(dirs,function(x){
      i<-Read10X(x)
      sc<-CreateSeuratObject(i, project=meta.data[which(meta.data$dirs==x),1])
      sc@meta.data$cell.id<-rownames(sc@meta.data)
      sc@meta.data<-left_join(sc@meta.data,sub.meta.data,"orig.ident")
      rownames(sc@meta.data)<-sc@meta.data$cell.id
      return(sc)
})
sc.merge=merge(x = datalist[[1]], y = datalist[2:length(datalist)])
save.rds(sc.merge,"sc.merge.rds")
sc.merge.png

此时的counts矩阵的meta.data$groups的T代表癌症细胞,N代表正常细胞,meta.data$orig.ident保存了细胞的批次信息。此时的counts矩阵未作任何处理,接下来需要批次校正...

上一篇 下一篇

猜你喜欢

热点阅读