单细胞数据标准分析——快速、高效、专业化

2022-11-18  本文已影响0人  百奥智汇

随着单细胞测序技术的普及,越来越的研究者开始意识到该技术的广泛适用性和强大的探索能力。尽管如此,很多研究者在应用该技术时仍面临困难,这主要体现在单细胞测序数据的分析和解读上。

有鉴于此,百奥智汇基于自身丰富的生物信息学经验和强大的算法开发能力,建立了标准化的单细胞数据分析流程,为用户提供多规格、前沿、可定制的单细胞数据分析服务。具体而言,我们的数据分析服务随着分析深度和难度的增加分为三种类型——标准分析、高级分析和定制化分析。

本文从分析内容、数据结果展示&解析、产品优势三个方面,对标准分析服务进行介绍。

一、分析内容

百奥智汇标准分析服务旨在帮助研究者快速认识单细胞组学数据特征,理解细胞异质性,发现潜在细胞功能亚群,将以数据文件的形式交付单细胞表达谱矩阵或染色质开放性矩阵、特征基因(差异表达)列表、TCR/BCR序列和克隆型列表等,并以多媒体报告的形式提供数据的二维展示(t-SNE&UMAP)、细胞注释、富集分析和其他统计分析结果。从接收数据至给出报告的周期为10个工作日。

图1 百奥智汇标准分析流程及结果

二、分析结果展示&解析

细胞质控

细胞质控的目的是过滤掉低质量细胞,以保证下游分析过程中所用数据均为单个活细胞的生物学信息。

图2 细胞质控结果

降维聚类:

降维聚类是为了将单细胞测序数据变为可视化的图像,该过程以基因表达为变量,经过多种降维算法(PCA、tSNE、UMAP)处理可获得样本和重要基因的表达特征,并转化为可视化结果。然后,经过聚类算法(Leiden)可将细胞划分为一个个的聚类。

图3 tSNE&UMAP展示样本的组织来源和患者来源信息 图4 tSNE&UMAP展示样本的聚类结果

批次矫正:

单细胞测序与所有基因组学实验一样,会产生批量效应并阻碍数据的集成和解释。因此,百奥智汇会依据自身丰富的经验对数据的批次效应进行评估和矫正。

图5 批次效应影响示意图(左图为受批次效应影响试验结果,右图为未受批次效应影响结果)

差异表达分析:

对数据进行聚类后,可对聚类所得细胞群进行基因差异表达分析,对找到的特征基因(marker gene)进行排序,并选取前n个特征基因,为给定的细胞与特征生成表达热图。也可通过UMAP/tSNE图,对单个特征基因表达量的差异进行可视化展示。

图6 不同细胞群的特征基因表达热图 图7 不同特征基因表达UMAP图

富集分析:

Gene Ontology(简称GO)是一个国际标准化的基因功能分类体系,供了一套动态更新的标准词汇表来全面描述生物体中基因和基因产物的属性。GO总共有三个Ontology,分别描述基因的分子功能(Molecular Function)、细胞组分(Cellular Component )、生物过程(Biological Process) 。通过GO功能显著性富集分析,能够确定差异表达基因行使的主要生物学功能,其结果可结合差异表达基因中的Marker帮助我们判断细胞类型。

图8 富集分析结果(GO)

细胞类型注释:

细胞类型注释是根据细胞的特征基因(marker基因)进行注释,一般分为自动注释和手动注释两种。在百奥智汇标准分析流程中,我们会利用自有的marker基因库、先验数据集和自主开发的自动注释算法,对细胞类型进行自动注释。

图9 细胞类型自动注释结果

TCR/BCR分析:

对于TCR/BCR数据,百奥智汇标准分析流程将交付TCR/BCR序列和克隆型列表。此外,TCR/BCR数据结果亦可通过Cellranger报告和Loupe Browser进行查看和解读。

图10 使用Loupe Browser查看TCR/BCR数据

染色质开放性分析

(scATAC-seq):

对于单细胞染色质开放性测序产生的数据,百奥智汇标准分析流程能够根据基因启动子的区间开放程度,将单细胞染色体开放区域数据转换成标准化的类单细胞表达矩阵,然后用标准化矩阵进行聚类与降维,生成基于ATAC数据的可视化结果(t-SNE、UMAP等多种算法),并根据该结果进行细胞类型注释。此外,还能够比较细胞类型之间的差异富集区域,揭示细胞类型特异开放的转录因子结合区域。

图11 基于scATAC-seq得到的UMAP可视化结果

空间转录组分析:

对于空间转录组数据,百奥智汇标准分析流程可基于Spot得到的基因表达矩阵进行分析,经过标准化、降维、聚类等生成数据的二维展示(t-SNE、UMAP等多种算法)和基于Spot的分群,比较Spot分群之间基因表达差异,鉴定差异表达基因,然后根据差异表达基因做下游分析,如基因功能富集分析等。此外,还可以对聚类结果进行细胞类型注释。

图12 空间转录组分析结果

三、我们的优势

总之,百奥智汇团队凭借自身丰富的生物信息学经验和强大的算法开发能力,建立了标准化、专业化的单细胞数据分析流程,可最大限度的去除数据噪音,快速高效地获取数据结果,帮助研究者根据具体的科学兴趣,深入挖掘数据的生物学内涵,阐明不同组织细胞异质性背后的生物学意义。

如果您对单细胞和空间转录组相关内容感兴趣,请关注百奥智汇公众号(Abiosciences),联系我们。

上一篇下一篇

猜你喜欢

热点阅读