文献分享——Predicting transcription f

2021-07-21  本文已影响0人  生信小工厂

通过深度学习预测单个细胞中的转录因子结合

期刊名: Science advances
影响因子: 13.116
发表日期: 2020.12.18
下载地址: https://advances.sciencemag.org/content/6/51/eaba9031

一、文章概览

描述转录因子(TF)的全基因组结合谱对于理解生物过程至关重要。尽管已经开发了评估细胞群内结合谱的技术,但在单细胞水平上确定它们的方法仍然遥遥无期。

本文提介绍了scFAN(single-cell factor analysis network单细胞因子分析网络),这是一种深度学习模型,可以预测单个细胞中全基因组的转录因子结合网络。

scFAN包括对大量的数据进行“预训练模型”训练,然后使用DNA序列数据,汇总的相似scATAC-seq数据和可定位性数据的组合,将其用于预测单细胞水平上的转录因子结合。

scFAN提供了一种有效的方法来预测单个细胞的不同转录因子的结合谱,可用于分析单细胞表观基因组学预测细胞类型

二、scFAN流程概览

scFAN pipeline

分别准备单细胞和Bulk的ATAC-seq、bigwig信号、序列信息,还有可映射性特征数据。

先对于Bulk数据,以ATAC-seq,序列信息,可映射数据作为特征,输入深度学习模型中,优化了预训练模型

对于每个单细胞,都有各自对应的ATAC-seq,序列信息,可映射数据,每个细胞都有其对应的特征矩阵,将这些矩阵输入Step2中已经预训练过的模型中。

对特征矩阵进行排序和二值化,计算每个细胞的前N个motif出现的概率,根据概率值绘制热图,分析在不同单细胞中的转录因子出现的概率从而将单细胞归类,进行单细胞数据的下游分析

三、Bulk数据分析

Bulk数据组成 AUC 和 AUPR 交叉验证

四、单细胞数据分析

Single-cell数据组成

五、讨论

六、补充

引入 TF activity score 研究预测的转录因子结合谱是否可用于区分细胞类型。

TF activity score

由图知:

上一篇 下一篇

猜你喜欢

热点阅读