多组学知识基础生信修炼

复习ChIP-Seq的基础知识

2020-03-10  本文已影响0人  刘小泽

刘小泽于19.2.3首次接触ChIP-Seq
中间也没怎么做过相关的项目,不过现在要重拾起来咯,整理一下必备的背景知识(持续补充...)

背景知识

基本原理是:

特定时间点上用甲醛交联等方式“固定”细胞内所有DNA结合蛋白的活动,细胞内蛋白和DNA相互作用的关系被“截屏”了=》然后裂解细胞、断裂DNA(此时存在蛋白、与蛋白相连的DNA、游离的DNA)=》加上特定抗体取出蛋白及相连的DNA=》将与蛋白相连的DNA解离、纯化=》测序=》看到蛋白质抓取的片段们就是IGV中形成的峰,而游离的DNA们就没有峰

ChIP overview

发展

综述:ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia (2012)
https://www.ncbi.nlm.nih.gov/pubmed/22955991

染色质免疫沉淀(Chromatin immunoprecipitation ,ChIP)技术诞生很早,由Orlando等人创立于1997年,发表于2000年,先利用Microarray技术 ChIP-chip,后2007年利用DNA sequencing技术 ChIP-seq。虽然技术在进步,但都是要先通过免疫沉淀拉下来DNA。

它用来研究细胞内DNA与蛋白质相互作用,确定特定蛋白(如转录因子)是否结合特定基因组区域(如启动子或其它DNA结合位点),或确定基因组上与组蛋白修饰相关的特定位点。

提到两个组织:ENCODE(http://encodeproject.org/ENCODE/ )和modENCODE(http://www.modencode.org/ for small genomes),他们在4个物种(果蝇、秀丽隐杆线虫、人、小鼠)的100多种细胞做了超过1000次ChIP-seq实验,发现了140多种不同的因子和组蛋白修饰
【与外显子测序不一样,ChIP-seq不是通过设计好的探针来捕获序列,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获,哪里结合蛋白就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的】


刘小泽写于19.9.12
搜集整理一下必备生物知识

Part1

来自:http://www.biomart.cn/specials/biosense/article/109930

真核生物基因的多级调控:

转录调控要素:

顺式作用元件的表观修饰:

Part2 Epigenomics Fact Sheet

来自:https://www.genome.gov/about-genomics/fact-sheets/Epigenomics-Fact-Sheet

什么是表观组?

表观组做了什么?

人体中包含了超过万亿的细胞,在不同组织中担任不同功能,但是它们细胞核的基因组都是相同的,不同的就是其中不同的基因打开关闭状态。例如眼睛的细胞将检测光的基因特异性激活,而血红细胞会将与氧气运输相关的基因激活。


刘小泽写于2020.3.10
看到这篇写的不错:https://abego.cn/2019/08/10/first-series-the-protocol-of-chip-seq/#section-01

实验角度

染色质免疫沉淀测序技术(ChIP-Seq),用于寻找转录因子结合的DNA区域,以及寻找发生组蛋白修饰的基因组位置。

实验上可以分成:Cross-linked ChIP (XChIP)、Native ChIP (NChIP)
它们之间的比较:https://en.wikipedia.org/wiki/Chromatin_immunoprecipitation#Comparison_of_XChIP_and_NChIP

一般的实验步骤

  1. 首先用化学试剂(通常是甲醛)处理细胞或组织,以使蛋白质与DNA共价交联

  2. 然后进行细胞破碎和超声处理、消化完后, 利用核酸酶将染色质剪切成100-300bp的目标片段

  3. 再利用目标因子特异性抗体纯化

以上方法适用于能与染色质结合的蛋白质(转录因子,修饰的组蛋白,RNA聚合酶等

但还存在一些特殊情况:蛋白并没有特异抗体, 或者制备抗体的难度很高。那么就可以通过融合表达标签, 产生具有标签的标记因子,并通过对标签特异的抗体来进行富集

融合标签参考:http://www.biodiscover.com/news/research/730610.html
融合标签技术是20世纪末兴起的一种基因重组技术,利用重组DNA技术在靶蛋白编码基因的3'端或5'端融合某种标签的编码基因,通过适宜的宿主来表达重组蛋白质。
融合标签根据其分子量大小可分为两大类:大的蛋白质分子(或蛋白质结构域及其衍生物)和小的多肽片段

注意

ENCODE的ChIP-Seq指南

https://genome.cshlp.org/content/22/9/1813.full
对超过140种转录因子进行了超过一千次独立的ChIP-seq实验,并对多种动植物的100多种细胞类型进行了组蛋白修饰研究
其中包括:抗体验证,生物学重复,测序深度,数据质量评估

关于生物学重复

ENCODE根据细胞系,胚胎和组织样的实验情况。 进行了生物学重复的数量的评估. 结果显示:超过两个生物学重复的ChIP-seq实验没有显着改善位点发现。一般两个重复即可

关于数据量

推荐是哺乳动物每个生物重复至少使用10M unique比对的片段;如果是worms and flies :2M unique reads

反推数据量

如果去掉PCR重复和没有比对成功的reads(就按最后能得到75%的unique reads来算),并且使用PE 150测序,那么数据量就是:300bp * 10M / 0.75

更快地计算数据量

测序报告会给出reads数,如果测序策略是PE150,那么占用硬盘空间大小就是n(reads)*(150+150+45)/1024^3,然后测序仪下机后的数据都是用gz压缩后的文件.fastq.gz,能压缩约2.7倍

关于对照

必要性:

input对照

对照和处理在相同的条件下,进行交联和片段化,并提取DNA,这部分的DNA是没经过IP的DNA,其余全一样

Mock-ip对照

使用与目标蛋白无关的非目标抗体(IgG或者标签)进行“模拟”的IP,为了防止抗体的非特异性结合

注意

欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!
上一篇 下一篇

猜你喜欢

热点阅读