【张勇】ChIP-seq 讲习班
参考:
本讲 PPT 下载链接为:http://pan.baidu.com/s/1skJAaAx,密码:ga2l
视频链接:https://mp.weixin.qq.com/s/JLPQbgQKUpa4ONNhzURQxw
第一部分:ChIP-seq 简介
image.png- 首先了解两个概念:
Cistrome: the set of cis-acting targets of a transacting factor on a genome scale.
Epigenome: a parallel to the word "genome"; the overall epigenetic state of a cell
-
一般的双端测序,R1/R2 比对到两条链上面。通过Flag 可以提取比对到正反链的read,使用基因组浏览器可视化得到两个峰图。
(Tips:而ChIA-PET 也是双端测序,但是R1/R2 可能同一条链)
image.png image.png
- 张勇老师开发出第一个peak callling 工具(macs,现在更新到macs3,由师弟刘涛维护!)
- ChIP-exo : 从5 -end 进行酶切,提高TFBS分辨率,几乎直接看peak,而不需要软件找。
-
iChIP : 对不同细胞进行index,再进行抗体富集,运用到单细胞领域.
image.png
-
不同的TF 结合模型:
一般TF是sharp peak.
image.png
第二部分:ChIP-seq 实验设计
image.png image.png image.png-
关于实验重复及其测序深度:
- 以人类为例,一般对于转录因子达到20M,宽峰达到40M read 比较好。当然read越多越好,但是read 不太多,足以检测结合比较强的位点。
- 重复的问题,由于刚开始的一些文章ChIP-seq没有重复,带了一个不好的头,后面慢慢要求2-3个重复(2-3个质量好的重复,不是做了3个重复就好)。
-
对照组:一般来说Input 和IgG 有一个就行,对于一些特别容易富集的区域,也就是假阳性,可以通过对照组来过滤掉。
第三部分:检测ChIP质量
image.png-
通过IGV浏览器查看peak 是否明显
image.png -
通过计算Frip 值:不同的TF,Frip 大小不同,结合越强的位点,Frip 可能越高
image.png -
交联系数:通过移动 计算正反链read 皮尔逊相关系数变化过程。
- 高质量的ChIP 正负链的peak ,移动到最大 重叠位置,相关系数最大,也就是图中ChIP peak 位置。
-
同时比较两个peak高度值,计算差异倍数,得到NSC/RSC 结果.下图左边为质量高的实验结果.
-
同时计算Frip 和NSC关系,两者之间存在明显的联系.也就是说Frip 高的NSC,RSC 往往也较高。
image.png -
IDR 方法:此方法对于重复间质量好的样本,IDR可能效果好,否则满足条件的peak 会很少。
从B图可知,20000左右的peak ,IDR (不可重复率)较低,也就是peak 很可信。
image.png image.png -
也可以通过peak 区域motif 富集情况,评价质量好坏。
image.png -
通过序列保守型来看:也就是通过通过profile 图反映出富集效果。
image.png
第四部分:完成项目后,需要提交哪些数据
image.png image.png image.png image.png第五部分:分析流程
image.png- 第一步:数据比对
- 下一步:peak calling
-
要发布的部分peak calling 工具
image.png -
下一步:差异peak 分析
- 定性问题:通过设置阈值,对两组sample进行peak 差异位点分析。得到有无peak的差异结果,但是对于一些在阈值边界的位置,可能得到的差异peak 位点,存在假阳性问题。
- 定量问题:通过差异倍数,及其显著性来判断差异peak. 对于组蛋白修饰来说,修饰水平的高度和表达强弱有关系;但是对于转录因子来说,可能没有太大影响。
- 差异peak 目前的工具
-
下一步:peak注释
image.png
-
下一步:motif 分析
image.png -
目前的工具
image.png -
下一步:靶基因预测
image.png -
也可以尝试对TF进行敲除,过表达研究目标基因.
image.png
-
下一步:目标基因GO注释
image.png
思考
- 感觉做差异分析时候,定量分析采取Deseq2 或者DiffBind 结果差别较大时候,不好判断选择哪一个工具result.
-
了解到ChIP-seq 靶基因寻找工具。比如结合RNA-seq结果,判断敲除TF,那些基因是差异基因。工具如BETA
欢迎大家评论留言,相互学习~