转录组研究chip-seq生信分析流程

ChIP-seq 基础知识介绍

2019-03-10  本文已影响217人  黄晶_id

染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。

ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

chip-seq 实战就跟在转录组和外显子上的实战是没有本质区别的,只是它多了一些分析,转录组只找表达量做差异分析,外显子只找变异做变异注释,那chip-seq 找的是peaks和motif 。

转录因子(Transcription Factors, TFs)是指能够以序列特异性方式结合DNA并且调节转录的蛋白质。转录因子与特异性DNA结合通常概括为“基序”(motif)

ChIP-seq实验的基本步骤包括:

  1. 通过甲醛使靶蛋白与染色质上目标区域的DNA交联结合

  2. 通过超声或酶解的方法将染色质破碎成小片段( 一般200-600bp合适)

  3. 使用特定抗体与靶蛋白结合富集目标区域的DNA(抗体的选择很关键哦~)

  4. 使靶蛋白与染色质上目标区域的DNA解交联,达到纯化DNA的目的

  5. 通过PCR或者是qPCR检测目标区域的DNA是否被靶蛋白富集到,然后再进行测序分析。

ChIP-seq的分析流程:

懒,没有整理成电子版的,字丑请自动忽略

怎样识别富集区域?

从DNA测序的角度来说,因为测序都是5'端的reads,对于一个DNA序列来说(有正负链的),它mapping的位置正负链都有的(也就是红色和蓝色的reads都有),对这些reads位置进行统计画图可以看到一个红色的peak,一个蓝色的peak。这两个peak说明的是一个事情,就是这个地方有富集。最后对这两个peak进行merge,最后变成了一个富集区域。灰色的peak!


image.png

ChIP-seq的常见峰型

不同类型的蛋白或者组蛋白修饰会得到不同的峰形。三种主要数据分布类型:

sharp binding sites, CTCF (red);

a mixture of shapes, RNA Polymerase II (orange);

medium size, H3K36me3 (green);

large domains, H3K27me3 (blue)


ChIP-seq的不同峰

富集倍数

一般来说富集倍数要在5以上才算是显著,如何计算富集比率呢?看图~

富集比率计算

部分参考资料来自:https://www.jianshu.com/p/87bc2002e82c
感谢这位老铁对我的帮助,好人一生平安。

上一篇下一篇

猜你喜欢

热点阅读