单细胞测序专题集合单细胞转录组单细胞

单细胞测序scRNA-seq技术学习笔记(二)——生信分析流程思

2019-10-08  本文已影响0人  2576710931dd

流程概述

具体操作

一、数据下载

NCBI选择GEO数据库
GEO数据库主页

二、数据整理,得到矩阵

数据整理,得到矩阵
样本基因数目矩阵

三、质控与数据过滤

3.1 质控

质控:小提琴图

3.2 数据过滤

基因在所有细胞的表达量波动情况

四、PCA主成分分析

PCA主成分分析

数据降维:

绘制PCA热图

PCA热图
PCA热图

由于TSNE聚类分析时需要筛选PC,需要对PCA得到的结果进一步筛选,但是PCA又不能选择地太少(会使得全部基因的信息量丢失),选择一个折中的方法,通过图形选择那些p-value小于0.05的关键PC:

此处选择了p-value小于0.05的20个PC

PCA主成分分析 主成分的p值

五、tSNE聚类分析

tSNE聚类分析

聚类热图:

聚类热图

六、marker基因

寻找marker基因
Marker基因的判定标准:

此处针对以cluster10,即B细胞的差异(Marker)基因进行分析:
选出两个基因进行绘图(其中横坐标为各个cluster,纵坐标为对应基因的表达水平)

marker基因的小提琴图

绘制聚类图展示查看差异情况:

注意B细胞聚类cluster10的位置,红色方向表示基因的高表达


marker基因在各个cluster的散点图

绘制气泡图展示查看差异情况:

marker在各个cluster的气泡图

其中,横坐标代表cluster10的Marker基因,纵坐标代表各个cluster
结论:

  1. 前五个基因,在cluster10中的表达是上调的
  2. 后五个基因,在cluster10中的表达是下调的

七、注释细胞类型

这部非常难


注释细胞类型

注释的方法:

可能有多个cluster被注释上相同的细胞类型

八、细胞轨迹分析

这步也非常难


对cluster做的细胞轨迹分析
对注释出的细胞类型做的细胞轨迹分析

其中:

需要根据软件预测、经验、文献、对这个细胞测序过程的理解,判断哪个细胞可能在前面分化出来

有经验的情况的分析思路:
根据前面打的研究、经验,知道哪种细胞在肿瘤中最先出现,预判细胞轨迹的起点(树根)

没有经验,不知道细胞出现先后的分析思路:
猜测:细胞种类单一、数量较少 ---分化---> 细胞种类多,数量多

九、GO功能富集

对Marker基因进行GO分析

基因名字转换基因id

基因名字转换基因id

十、KEGG通路富集

KEGG通路富集
  • 学习自“生信自学网”等网站
上一篇 下一篇

猜你喜欢

热点阅读