生信自学网单细胞测序(二)

2020-03-21  本文已影响0人  cHarden13

数据的过滤、标准化、聚类、注释
这一部分主要是基于Seurat包和SingleR包进行
输入文件为表达矩阵geneMatrix.txt

1.读取文件

将geneMatrix.txt读入R,同时判断矩阵中有无重复基因(即相同的第一列名),若有,则取平均值-使用limma里avereps()

2.将矩阵转换为Seurat对象
3.对数据进行过滤

过滤分为两步,首先画小提琴图,根据小提琴图看需要设置的阈值是多少;然后使用subset()进行过滤。

4.测序深度的相关性绘图
5.数据进行归一化(normalizing)

归一化目的为消除测序深度影响和消除表达量差异过大产生的影响。
方法是将测序深度标准化为一个定值和取log。

6.鉴定细胞间表达量差别大的基因
7.数据标准化(scaling)

ScaleData()

8.聚类

使用PCA法+tSNE法或ElbowPlot+UMAP法

9.寻找差异表达的特征
10.使用SingleR包注释细胞类型
上一篇 下一篇

猜你喜欢

热点阅读