[0] ChIP-seq 从实验到分析详细学习
2019-06-24 本文已影响16人
热衷组培的二货潜
至我即将从头到尾学习的
ChIP-seq
的巨坑,这是一个保守估计要花一个月的学习记录。
加空行: 把封号换成英文的
目录至上
1 ChIP-seq 简介
1.1 ChIP-seq 实验
1.2 方法的改进
1.2.1 ChIP-exo
1.2.2 ChIP-nexus
1.2.3 CUT & RUN
1.2.4 DamID
1.3 ChIP-seq 数据分析流程
1.4 ChIP-seq 实验的设计
1.4.1 ChIP-seq control(对照)
1.4.2 bias
的来源
1.4.3 抗体质量
1.4.4 Read
深度
1.4.5 Read
属性
1.4.6 重复
2 序言
2.1 ChIP-seq 数据集
2.2 计算环境准备
2.2.1 计算环境
2.2.2 数据
2.2.3 软件
2.2.4 文件格式
2.3 从 GEO
检索数据
2.4 编程小提示
2.5 图形用户界面工具
3 通常的质量控制
3.1 简介
3.1.1 FASTQ
文件
3.1.2 可用的工具
3.2 质量检测的措施
3.2.1 Selected quality metrics
3.2.2 FastQC
3.3 修剪和过滤
3.3.1 去除接头
3.3.2 低质量的修剪
3.3.3 Trim Galore
4 基因组比对
4.1 简介
4.1.1 比对的概念
4.1.2 可用的工具
4.2 参数和注意事项
4.2.1 错配 Mismatches
4.2.2 多重比对 Multi-mapping
4.2.3 其他参数
4.2.4 输出格式
4.3 使用 Bowtie2
进行基因组比对
5 特异性 ChIP-seq 数据质量控制
5.1 特异性 ChIP-seq 质量衡量
5.1.1 信号富集
5.1.2 正向
和 反向
reads 分布
5.1.3 重复 reads
5.2 ChIPQC
6 Peak Calling
6.1 ChIP-seq 信号类型
6.1.1 对于转录因子
类型的 Sharp
尖峰信号
6.1.2 对于组蛋白修饰
类型的 Broad
宽峰信号
6.1.3 对于 RNA聚合酶II
类型的 Mix
混合信号
6.2 Peak Calling
产生的算法
6.2.1 片段大小的估计
6.2.2 reads 的富集程度
6.2.3 显著性得分
6.2.4 多重检验校正
6.2.5 阈值的选择
6.3 现有工具和注意事项
6.3.1 单末端与双末端文库
6.3.2 测序深度和文库复杂度
6.3.3 实验分辨率
6.3.4 新生代 Peak calling
工具
6.3.5 事后处理
6.4 Peakzilla
用于转录因子类型的工具
6.5 MACS2
用于组蛋白修饰类型数据
6.6 饱和度分析
7 数据可视化
7.1 reads 密度
7.2 Peak 区间
7.3 基因组浏览器
8 比较分析
8.1 Peak 区间的交集
8.2 IDR(IRREPRODUCIBLE DISCOVERY RATE)
8.2.1 使用 IDR
进行 Peak calling
8.2.2 计算IDR
8.3 read 密度比较
8.3.1 合并 Peak 区间
8.3.2 计算每个样本的 reads 数目
8.3.3 对 reads 数目进行标准化
8.3.4 reads 数目的比较
8.4 差异结合分析
8.4.1 使用DESeq2
8.4.2 DiffBind
9 下游分析
9.1 基因组序列
9.1.1 基因组
9.1.2 离基因的距离
9.2 功能分析
9.2.1 注释到基因
9.2.2 基因富集分析
9.2.3 其他的基因富集分析方法
9.3 序列分析
9.3.1 Motif 分析
9.3.2 序列保守性分析
9.4 结合其他数据分析
9.4.1 更多的 ChIP-seq 数据集
9.4.2 表达数据
9.4.3 其他类型数据
参考文献