单细胞RNA测序研究癌症异质性
2021/03/03
Studying Cancer Heterogeneity by Single-Cell RNA Sequencing
治疗癌症的一个主要障碍是不了解它出现,扩散和复发的演变过程,测量同一肿瘤细胞内基因表达水平的变化对于癌症治疗是至关重要的。最近开发的单细胞RNA测序( single-cell RNA-sequencing)技术已成为癌症研究的宝贵工具。
在这里,描述了MCSCRB-seq (molecular crowding single-cell RNA barcoding andsequencing),这是一种高度敏感和强大的基于平板的scRNA-seq方法,它显示出很大能力产生癌细胞的转录组数据。
一、Primary Data Analysis
1、基于Phred分数的测序reads过滤(filtering of sequencing reads based on Phred scores)
2、比对到参考基因组(mapping to the reference genome)
3、分配特征( assigning features)
4、每个基因独特分子标识符的计数( counting of unique molecular identififiers per gene)
Tool:zUMISs ----> digital gene expression (DGE) matrices : 样本(条形码)作为列,基因作为行
二、Analysis of Heterogeneity
分析DGE matrices :R and RStudio
1、需要通过排除UMI与大多数细胞相比明显更少或更多的细胞来过滤掉双细胞和破碎细胞。
2、筛选出数据集中仅有零星检测的基因。
3、数据需要进行标准化,有几种方法规范噪声单细胞数据(noisy single-cell data),这也处理零膨胀(zero inflation)的问题。(using scran or SCnorm)
4、为了识别表达异质性,通过降维分析(dimension reduction analysis,like principal component analysis 主成分分析 or t-distributed stochastic neighbor embedding (tSNE))可视化被标准化计数数据的潜在方差结构(underlying variance structure of the normalized count data can be visualized)。这些方法可能将细胞的部分分配到簇,以识别具有不同表达谱的亚群体,进行差异基因表达分析。