2022-03-18
2022-03-30 本文已影响0人
oceanandshore
第一步:数据和改名
把下载后的三个文件解压,之后再把三个文件重命名改成 badcodes.tsv.gz genes(features).tsv.gz matrix.mtx.gz 把这三个文件单独放到一个文件夹里面
第二步:读取文件:read10X
读取成功后 ,在环境里面就生成了读取后的文件
第三步:用seurat创建对象,运行后在环境里生成 Large seurat 文件(这个文件就是后续分析的完整矩阵)
总细胞数不低于3个 基因数不低于50个
补充:或者读取文件的时候也可以读取 csv.gz 文件
第四步:数据简单查看,以这个为例:这个文件的后五行基因名不对,剔除掉 这一步在创建对象之前
meta data 是 这个实验的临床信息,在下载页面的 SRA RUN Selector 里
打开就是下面那张图,然后下载
下载好的 meta data 是这个样子的
先读取 meta data 数据
“,” 意思是这个文档是用 ,分割的
新建一个 new b 提取 b 里面有用的信息
然后继续创建对象,把 mate data 加进去
质控:
查找线粒体基因
percent .mt 是线粒体基因百分比
接下来去除表达基因少于500 或 多于 6000 的细胞。去除线粒体 RNA 比例高于 40% 的细胞 (具体情况具体分析)
然后画一下 RNA 总量 的图
走完以上步骤就完成质控。接下来: 鉴定 高变异 基因
接下来是 PCA 聚类 (这里看了前5个主成分 dims = 1:5)
接下来画 JackStraw 图 和 E lbow Plot 图
JackStraw 图
E lbow Plot 图
T-SEN 聚类分析
然后得到一个 17 (意思是分成17个群)
然后是 T-SEN 可视化
现在还不知道这17个是什么群体,后面会对群体进行注释
用 Single R 细胞注释: 用到两个包: celldex 和 Single R 并且可以搜索不同的数据库进行注释
Seurat 细胞亚群差异基因鉴定: FindAllAMarker
细胞亚群差异基因鉴定也可以在亚群注释之前
挑选 p < 0.05 和 log 2FC > 1 的基因
Monocle 拟时序分析