组学磕盐——从入门到自闭课题

2020 scATAC-seq Harward Liu

2020-04-13  本文已影响0人  caokai001

了解scATAC-seq 背景知识(youtube Shirley)

1.2020 STAT115 Lect16.1 Intro to Single-Cell ATAC-seq

image.png image.png image.png image.png image.png

提问:短的片段更容易得到扩增.



2.STATi15 Lect16.2 Preprocessing and QC scATAC-seq

image.png image.png image.png image.png image.png

提问:为什么count 数目只能是0,1,2 ?
总体read 有成千上万个reads,平均到每一个细胞,只有几千个reads .DNA序列大多数只有2倍拷贝, 对于癌症细胞来说,可能存在很少的3,4 拷贝。



3.2020 STAT115 Lect16.3 Analysis of scATAC-seq

当我们得到peak_by_cell matrix. 需要进行下游分析.


2020年5月25日17:17:31 image.png





下面两个slide 将从motif/TF ChIP-seq 数据检测那个TF明显富集某个细胞.

Annotation Relevant TFs with Motif

接下来,我们就需要进行差异peak. (tips: 需要将细胞reads 进行归一化,10k/cell) 再进行M-W test(几万次)

scRNA-seq 判断不同cluster每一个gene 显著性. scATAC-seq判断不同的cluster每一个peak 显著性.一般需要6小时的,Presto 只需要15 秒就完成.

image.png

当然在人类基因组中通过motif 预测TF结合还存在很多影响因素. 所有通过证实的转录因子数据效果更好.

image.png
用TF ChIP-seq peak 和单细胞peak区域进行overlap 来衡量 image.png



4.2020 STAT115 Lect16.4 Integrating scATAC-seq with scRNA-seq

image.png
几十万行的peak-cell matrix 转换成2万行 gene-cell matrix;MAESTRO采用基于距离的算法对peak 加上权重,越靠近乘以1,越远(100kb)乘以很小的值 来表示此基因是否表达 image.png image.png
这部分不太懂,大概说scATAC-seq 转换成的gene_cell_matrix和scRNA-seq matrix 相关系数类似. 不像scRNA-seq 重复之间那么高。 image.png image.png
岭回归和lasso回归 可以进行特征选择,我们在生物统计学课程了解到
可以获得几千个差异基因,需要用lasso进一步对gene 添加权重 image.png image.png

反思:

水平有限,好多slide 没听懂讲什么内容 φ(* ̄0 ̄)

上一篇下一篇

猜你喜欢

热点阅读