Single cell analysis

无痛从seurat迁移到monocle3(UMAP seurat

2022-04-29  本文已影响0人  单链结合蛋白

注意,这里使用的seurat对象要求已经run过runUMAMP()
findCluster等函数,否则也没有必要把seurat的结果弄到monocle3的cds对象里

1. 从seurat对象手动创建cds对象

library(Seurat)
library(monocle3)
library(tidyverse)
library(patchwork)
rm(list=ls())
dir.create("Monocle3")
setwd("Monocle3")##创建CDS对象并预处理数据
pbmc <-readRDS("pbmc.rds")
data<-GetAssayData(pbmc,assay ='RNA',slot ='counts')
cell_metadata <-pbmc@meta.data
gene_annotation <-data.frame(gene_short_name =rownames(data))
rownames(gene_annotation)<-rownames(data)
cds <-new_cell_data_set(data,cell_metadata =cell_metadata,gene_metadata =gene_annotation)

来源:(https://www.jianshu.com/p/c402b6588e17)

上面的是中文的教程,还包含手动把seurat中的umap的数据传入cds的操作,适合不想官方文档的时候看,挺适合新手上手的。

2. 使用seuratwrapper自动导入seurat中的数据;

教程来源:

Building trajectories with Monocle 3

来自 <https://satijalab.org/signac/articles/monocle.html>

library(SeuratWrappers)

注意seuratWrappers包提供了seuart对象到其他包的多种接口,可以把seurat对象转换为其他对象;

这里是把seurat对象转换为了cds对象;

erythroid.cds<-as.cell_data_set(erythroid)
erythroid.cds<-cluster_cells(cds =erythroid.cds, reduction_method ="UMAP")
erythroid.cds<-learn_graph(erythroid.cds, use_partition =TRUE)
#这个教程是已经手动提供了root的细胞,如果没有这个文件,order_cells()会开一个窗口,然后让人选root。
#hsc是教程中给的root的文件,实际操作的时候,可以不用给这个参数,直接选择弹出的窗口中的细胞即可;
# order cells
erythroid.cds <- order_cells(erythroid.cds, reduction_method = "UMAP", root_cells = hsc)
lymphoid.cds <- order_cells(lymphoid.cds, reduction_method = "UMAP", root_cells = hsc)

# plot trajectories colored by pseudotime
plot_cells(
  cds = erythroid.cds,
  color_cells_by = "pseudotime",
  show_trajectory_graph = TRUE
)
plot_cells(
  cds = lymphoid.cds,
  color_cells_by = "pseudotime",
  show_trajectory_graph = TRUE
)

#提取pseudotime的结果,并加到metadata上面;
bone <- AddMetaData(
  object = bone,
  metadata = erythroid.cds@principal_graph_aux@listData$UMAP$pseudotime,
  col.name = "Erythroid"
)

bone <- AddMetaData(
  object = bone,
  metadata = lymphoid.cds@principal_graph_aux@listData$UMAP$pseudotime,
  col.name = "Lymphoid"
)
#可视化结果;
FeaturePlot(bone, c("Erythroid", "Lymphoid"), pt.size = 0.1) & scale_color_viridis_c()

上述的教程只是比较方便的把seurat对象转变成了cds对象,同时把UMAP PCA等数据也给maping过去了,但是没有把seurat_cluster弄过去,没有把gene_short_name弄过去

自己的搜集到的解决的方法:

3.使用自己看到的方法

cds2 <- as.cell_data_set(x = TregCell)

#mapping cluster

#cds对象的cds2@clusters$UMAP$clusters是一个named vector。

cds2@clusters$UMAP$clusters <- Idents(TregCell)[rownames(colData(cds2))]

#parition的数目根据自己的实际情况处理,如果后面的 learn_graph(cds2, use_partition = F)的use_partition为F,则不用partition来做不同pseudotime推测,没有没有必要设置partition;

cds2@clusters$UMAP$partitions <- factor(x = rep(1, length(rownames(colData(cds2)))), levels = 1)

names(cds2@clusters$UMAP$partitions) <- rownames(colData(cds2))

#从seurat obj transfer过去的cds对象没有做estimate size factor参数

## Calculate size factors using built-in function in monocle3

cds2 <- estimate_size_factors(cds2)

#创建cds对象的时候,cds要求gene_meta这gedf必须要有一列为gene_short_name

## Add gene names into CDS

cds2@rowRanges@elementMetadata@listData$gene_short_name <- rownames(cds2)

#如果出现了order_cells(cds)报错"object 'V1' not found",否则不执行

#来源:https://github.com/cole-trapnell-lab/monocle3/issues/130](https://github.com/cole-trapnell-lab/monocle3/issues/130

###############################################################
rownames(cds2@principal_graph_aux[["UMAP"]]$dp_mst) <- NULL
# colnames(cds@reducedDims$UMAP) <- NULL
colnames(cds2@int_colData@listData$reducedDims@listData$UMAP) <- NULL
###############################################################

cds2 <- learn_graph(cds2, use_partition = F)
cds2 <- order_cells(cds2)
plot_cells(cds2, color_cells_by = "pseudotime", label_cell_groups=F, label_leaves=FALSE, label_branch_points=FALSE, graph_label_size=1.5)

plot_cells(cds2)

以上代码得到了使用seurat对象里的UMAP以及seurat_cluster得到pseudotime。

参考:https://github.com/cole-trapnell-lab/monocle3/issues/262

上一篇下一篇

猜你喜欢

热点阅读