知识点chipseq复习相关

一文读懂 ChIPseq

2020-11-26  本文已影响0人  白墨石

一、介绍

二、测序原理

1、使用甲醛将目标蛋白(组蛋白,转录因子等)与染色质交联固定起来

mark

2、从细胞裂解液分离基因组DNA,通过超声打断DNA为一定长度的小片段

mark

3、添加与目标蛋白质特异的抗体,该抗体会与目标蛋白形成免疫结合复合体沉淀,收集这些沉淀

免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA

mark

4、去交联,分开蛋白与DNA,纯化DNA即可得到染色质免疫沉淀的DNA样本

mark

5、建立好文库,用测序仪进行测序

详细测序过程可以参考:https://zhuanlan.zhihu.com/p/58708887

mark

三、检测蛋白质与DNA序列的结合峰

1、测序片段匹配到参考基因组

将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组。

很显然,如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。

mark
2、检测峰

将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。

这里需要知道,ChIPseq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。

我们一般用 ChIPseq 检测转录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:

转录因子结合的特征峰,峰型高,而且窄:

mark

组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:

mark

当然我们也可以使用,UCSC基因组浏览器显示。

mark
3、提高峰质量

一般在做ChIPseq时,会加入一组空白对照(control),提高峰质量,那么为什么?

所以会准备空白对照,排除假阳性,对照组有有两种类型:

这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。

四、影响ChIPseq测序结果的因素

1、免疫共沉淀的影响

对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。

对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。

-Subhash Tripathi,ResearchGate

2、测序的影响
测序深度的对组蛋白修饰检测的影响

下面是在不同测序深度下检测人的 H3K4me3 组蛋白修饰ChIP图谱。

绿色框对应于基于SPP宽峰检测方法得到的显著富集区域。

在 5M (500 Reads) 中,未检测到突出显示的富集区域。

mark

同样,我们换成 H3K27me3 组蛋白修饰。

这时在3.5M和10M 的低深度处未检测到突出显示的HOXD11和HOXD-AS1基因座处的富集区域(蓝色框)。 mark 从每个子样本中H3K4me3,H3K36me3和H3K27me3回收的全部数据中获得的显著富集区域的百分比 mark

总的来说,随着测序深度增加,组蛋白修饰检测比例开始会快速增加,随后达到平稳。测序深度饱和点取决于组蛋白修饰和所研究的物种基因组。

3、重复样和重现性

参考:

https://academic.oup.com/nar/article/42/9/e74/1248114

https://en.wikipedia.org/wiki/ChIP_sequencing#/media/File:Chromatin_immunoprecipitation_sequencing.svg

https://www.abcam.com/epigenetics/studying-epigenetics-using-chip

上一篇下一篇

猜你喜欢

热点阅读