2022-03-18

2022-03-30 本文已影响0人 oceanandshore

第一步：数据和改名

把下载后的三个文件解压，之后再把三个文件重命名改成 badcodes.tsv.gz genes(features).tsv.gz matrix.mtx.gz 把这三个文件单独放到一个文件夹里面

第二步：读取文件：read10X

读取成功后，在环境里面就生成了读取后的文件

第三步：用seurat创建对象，运行后在环境里生成 Large seurat 文件（这个文件就是后续分析的完整矩阵）

总细胞数不低于3个基因数不低于50个

补充：或者读取文件的时候也可以读取 csv.gz 文件

第四步：数据简单查看，以这个为例：这个文件的后五行基因名不对，剔除掉这一步在创建对象之前

meta data 是这个实验的临床信息，在下载页面的 SRA RUN Selector 里

打开就是下面那张图，然后下载

下载好的 meta data 是这个样子的

先读取 meta data 数据

“，” 意思是这个文档是用，分割的

新建一个 new b 提取 b 里面有用的信息

然后继续创建对象，把 mate data 加进去

质控：

查找线粒体基因

percent .mt 是线粒体基因百分比

接下来去除表达基因少于500 或多于 6000 的细胞。去除线粒体 RNA 比例高于 40% 的细胞（具体情况具体分析）

然后画一下 RNA 总量的图

走完以上步骤就完成质控。接下来：鉴定高变异基因

接下来是 PCA 聚类（这里看了前5个主成分 dims = 1:5）

接下来画 JackStraw 图和 E lbow Plot 图

JackStraw 图

E lbow Plot 图

T-SEN 聚类分析

然后得到一个 17 （意思是分成17个群）

然后是 T-SEN 可视化

现在还不知道这17个是什么群体，后面会对群体进行注释

用 Single R 细胞注释：用到两个包： celldex 和 Single R 并且可以搜索不同的数据库进行注释

Seurat 细胞亚群差异基因鉴定： FindAllAMarker

细胞亚群差异基因鉴定也可以在亚群注释之前

挑选 p < 0.05 和 log 2FC > 1 的基因

Monocle 拟时序分析

上一篇下一篇

猜你喜欢

热点阅读