生物分子网络构建和分析ATAC seq单细胞转录组

整合多种指标确定单细胞基因调控网络中的关键基因

2021-08-03  本文已影响0人  被格格巫抓到的蓝精灵

今年三月份南京航空航天大学姜维老师团队发表在Molecular Therapy Nucleic Acids(8.886)一篇关于scRNA-seq基因调控网络的文章——Single-cell RNA-seq dissects the intratumoral heterogeneity of triple-negative breast cancer based on gene regulatory networks 。使用scRNA-seq对TNBC患者内不同亚型的GRN进行了全面分析。然后整合5种不同的指标,确定了每种亚型的关键调控子。从而分析TBNC的瘤内异质性,识别TNBC的关键基因。

一、背景:

乳腺癌是女性最常见的肿瘤之一,肿瘤内异质性高。传统上基于免疫组化特征,乳腺癌患者可以被归类为4种不同的亚型,这四个亚型的病理学特征和预后结果存在差异。随着单细胞技术的发展,我们可以在癌症研究的单细胞分辨率上深入了解遗传异质性。然而传统的基于bulk RNA-seq的乳腺癌分析是非常不够的,基于scRNA-seq数据构建了基因调控网络(GRNs),有助于识别疾病中的关键调控因子。

二、数据与代码:

  1. 6名TNBC患者的scRNA-seq数据:GSE118390 <u>https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE118390</u>

  2. 来自TCGA的105正常样本和115 TNBC 样本的表达数据;

  3. 来自METABRIC数据库的186个TNBC的临床数据

三、文章的整体流程

流程图

四、内容和结果

一)TNBC患者的内在分子亚型

PAM50:一个50个基因的signature,它将乳腺癌分为5种分子亚型:Luminal A, Luminal B, Her2 -enriched,Basal-like和Normal-like。其生物学特征和预后均存在差异。

Fig.1 Fig.2

二)分子亚型特异的GRNs

基于共表达谱和转录因子结合motif构建正常的上皮细胞和5个分子亚型特异的GRNs。
  1. 计算显著的共表达TF-gene对;

  2. 靶基因显著富集的TF-binding motif被保留以供进一步研究

  3. 富集分数(ES) >1被认为是构建GRN的显著TF靶对。

正常上皮细胞和5种分子亚型的GRN的度分布均近似符合幂律分布,在各亚型特异性GRN中,TF的度表现出很大的差异。在5个分子亚型特异性GRN中没有一致调控因子(TF-target pairs),但在5个GRN中有10个一致的TF。这些相同的TF可能在不同的分子亚型中发挥不同的作用。

识别6个GRNs的关键基因
  1. 使用中心性度量来评估基因的重要性。中心性指标包括度、PageRank、中间性、特征值和近似性。

  2. 使用Q值整合5种中心性指标,每个网络综合Q统计量排名前1%的基因被认为是关键基因。

评估关键基因是否在癌症基因中富集,从Cancer Gene Census获得了已知的癌症基因。作者发现每个亚群中的关键基因显著富集在已知的癌基因。在每个亚型中,涉及到的癌症基因的关键基因表现出极大的多样性。

三)关键基因功能的多样性

为了研究5种分子亚型中关键基因的功能,作者重点研究了这些分子亚型中的一致的关键基因。除正常上皮细胞外,ETV6在五个分子亚型特异性GRN中均被激活(图3A-3F)。

Fig.3 Fig.4

五、结论:

作者使用scRNA-seq对TNBC患者内不同亚型的GRNs进行了全面分析。首先,作者使用scRNA-seq数据推断拷贝数变异(CNVs),鉴定出545个恶性细胞。然后根据PAM50模型对恶性细胞的亚型进行划分。细胞-细胞通讯分析显示巨噬细胞在肿瘤微环境中起主导作用。接下来,通过整合基因共表达和转录结合motif构建各亚型的GRN。接着,根据基因中心性指标识别出关键基因。然后分析关键基因对于瘤内异质性的影响。

作者使用一种新的,确定单细胞基因调控网络中关键基因的指标——基因中心性指标。并为使用单细胞基因调控网络分析瘤内异质性提供了一种新的思路。作者结合不同维度的数据,利用生信分析,做出一篇如此完整的工作,值得我们借鉴~

上一篇下一篇

猜你喜欢

热点阅读