清除单细胞数据细胞周期效应造成的影响
unwanted sources of variation:
1.线粒体基因的干扰
2.细胞周期基因的干扰
seurat 包里有clear out cell cycle genes effect 的影响:
https://satijalab.org/seurat/v3.0/cell_cycle_vignette.html
细胞周期阶段的异质性,特别是有丝分裂细胞在S期和G2/M期之间的过渡,驱动大量的转录组变异,从而掩盖生物信号。
为了减轻这种影响,我们使用了两步方法:
1)使用已知阶段特异性marker gene的监督分析量化每个细胞的细胞周期阶段;
2)用与上述相同的负二项回归回归细胞周期阶段的影响。
第一步,我们使用先前发表的细胞周期相关基因列表(43S期基因,54 G2/M期基因)进行富集分析,类似于文献11中提出的方法。
对于每个细胞,我们将相特异性基因表达的总和(log10转化UMIs)与100个随机背景基因集的分布进行比较,其中背景基因的数量与相基因集相同,背景基因从相同的表达箱中提取。表达式箱由50个相同范围的非重叠窗口基于log10(平均UMI)定义。相特异性富集分数是相对于背景基因集的均值和标准差的表达z分数。我们最终的“细胞周期评分”(扩展数据图1)是s期评分与G2/ m期评分的差异。
对于最终剔除细胞周期效应的归一化数据集,我们以技术因素和细胞周期评分作为预测因子,进行负二项回归。虽然细胞周期活动是从下游分析的数据中回归出来的,但我们在回归之前存储了计算出的细胞周期得分,使我们能够记住每个细胞的有丝分裂阶段。值得注意的是,我们的回归策略是为了减轻有丝分裂细胞在不同阶段的转录异质性的影响,并且不应该影响有丝分裂细胞和非有丝分裂细胞之间可能具有生物学意义的整体差异。
我真是被自己蠢哭
现找了一种方法,先做一遍,明天再和组里讨论。
转自:https://mp.weixin.qq.com/s/NcjHO0tVS583gvyW3xnhwA
还有 Jimmy 的
https://www.jianshu.com/p/aa867c3c12de