数据分析ATAC-seq,RNA-seq,表观遗传学CHIP-seq & ATAC-seq

ATAC-seq指南(一) ATAC-seq Guideline

2019-11-19  本文已影响0人  BioinfoFungi

写在前面(19.11.14,11.19)

最近需要写一份博士研究计划,感觉最近单细胞RNA-seq(scRNA-seq)和单细胞ATAC-seq(scATAC-seq)联合分析很火,想着在硕士研究的基础上蹭一下热度,单细胞水平达不到,可以用bulk cells嘛。 但是,作为一个生信小白,怎么才能写出一篇看起来是那么回事的研究计划呢? 之前在jimmy大神的生信技能树中看过很多关于ATAC-seq数据分析的文章,对理论知识和流程有所了解,但是就是处于光说不练瞎把式的状态,所以只能硬着头皮比着葫芦画瓢看看怎么写。 详细信息可以参见生信技能树的实操系列教程目录

ATAC-seq指南

意外的发现

在google一下的时候,突然发现了Harvard FAS的一篇文章 ATAC-seq Guidelines,感觉这篇文章讲的框架非常好,比较适合我这种急功近利对ATAC-seq做一个全面了解的人,因此我特地把我的一些收获写出来。不是单纯的翻译,只是记录一些学习过程。 ##ATAC-seq 概况 我的理解:基因在进行调控时,其上游染色质是属于开放的状态,探究这种开放的情况可以获得该状态下整体的基因调控情况。T5转座酶是可以插入到开放的区域并切割DNA片段,因此将T5转座酶连接上特异性的 adapters,再将片段收集测序,就能得到全基因度尺度上处于开放状态的染色质区域。详细知识参考ATAC-seq基础知识 文献:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4374986/

ATAC-seq overview

实验设计

具体参见detailed protocol

一些注意事项:(太长不看版)

  1. 重复:一般两个足够。

  2. 对照:一般不用,可以使用不加转座酶,然后加上接头的片段化DNA。

  3. PCR扩增:建库过程中少进行PCR扩增,可能会影响后续分析。

  4. 测序深度:取决于基因组大小和染色质开放程度,人类样本5千万reads。

  5. 测序模式:推荐双端测序。

  6. 线粒体:最好去除,方法见 Omni-ATAC method

一些注意事项:(婆婆妈妈版)

  1. 重复 重复可以确保你的样品产生的数据是由生物效应引起的,而不是某个特定样本的特性或其处理过程造成的。 (这里我想到一个问题,像我研究的真菌是含有细胞壁的,酶解是去除细胞壁而又不伤害细胞核的方法,可以方便后续提取细胞核,但是酶解对细胞会产生一定的影响,尤其是如果实验处理就是温度处理的话,估计影响会很大。)

  2. 对照

    我的理解就是,分析的时候就可以把没有处理的作为对照,似乎不太需要单独做一个纯阴性对照。

  3. PCR扩增

    主要是关于PCR重复的问题,关于为什么会产生重复,重复会对后续分析产生哪些影响?

    可以参考以下几篇文章,都很有趣,值得学习。

    How PCR duplicates arise in next-generation sequencing试论NGS数据的Duplication问题 关于二代测序中的duplication如何去除二代测序数据中的PCR duplication才科学?

    我的理解就是建库加接头或者仪器读取过程中会产生PCR重复,而重复会对Peak calling产生影响,因此需要去除。

    Genrich 中,-r 可以进行PCR重复的移除。

  4. 测序深度:

    暂时不知道咋写

  5. 测序模式:

    双端测序的优势:

    1)有助于提高重复序列比对的准确性,参见 单端测序与双末端测序问题- 简书[序列拼接] 双端测序,原理+ 拼接(Pandaseq) - 知乎

    2)双端测序可以获得更多的关于转座酶插入位置的信息。

    3)单端测序中只要5‘ 端一样就会被认定为duplication,会产生假阳性的结果,也有可能去除了不该去除的序列,而双端测序避免了这种情况。

  6. 线粒体:

    ATAC-seq 中含有很大一部分线粒体DNA,参见this discussion

    而我们关注的只是核DNA,因此要对线粒体DNA进行去除,一般可以从实验方法和分析方法两个方面进行去除(同时进行)。

    实验方法去除可参见:Omni-ATAC methodATAC-seq Assay with Low Mitochondrial DNA Contamination from Primary Human CD4+ T Lymphocytesusing CRISPR to reduce mitochondrial contamination

    分析方法:Genrich中可以使用 -e chrM命令来去除线粒体的reads

总结

分析部分后续再写吧,还打算以一篇文章进行实战Chromatin Accessibility-Based Characterization of the Gene Regulatory Network Underlying Plasmodium falciparum Blood-Stage Development 另外,该指南还有一个旧版本,还没仔细看,目前新版本分析Peak-caliling中没有使用Macs2,而是用的Genrich,走Macs2流程的话请参见老版本

上一篇 下一篇

猜你喜欢

热点阅读