ChIP-Seq——MAnorm差异分析
一、 MANorm介绍
MAnorm是一个稳健的模型,用于定量比较 TF(转录因子)或表观遗传修饰的 ChIP-Seq 数据集。MAnorm 使用两个样本的共同峰作为参考来建立标准化的重新缩放模型,该模型基于经验假设,即如果染色质相关蛋白在两种条件下共享大量峰,则这些共同区域的结合将倾向于由类似的机制决定,因此应该在样本中表现出相似的全局结合强度。观察到的共同峰的差异被认为反映了两个样本之间 ChIP-Seq 信号的比例关系,可以应用于所有峰。
MANorm可以用于:
-
两个 ChIP-seq 样本的标准化
-
两个 ChIP-seq 样本的定量比较(差异分析)
-
评估蛋白质结合位点(峰)的重叠富集
-
阐明细胞类型特异性基因调控的潜在机制
二、安装
MAnorm 需要 Python 3.6+
pip install -U manorm
#或者
conda install -c bioconda manorm
manorm --version #检查是否安装成功
三、用法
1、命令
manorm --p1 peaks_file1.bed --p2 peaks_file2.bed --r1 reads_file1.bed --r2 reads_file2.bed
--n1 name1 --n2 name2 -o output_dir
#参数说明
--p1, --peak1
【必填】样品1的峰文件。
--p2, --peak2
[必填]样品 2 的峰文件。
--r1, --read1
【必填】读取样品1的文件。
--r2, --read2
[必填]读取样本 2 的文件。
--n1, --name1
样品名称 1。
--n2, --name2
样品 2 的名称。
-o
[必需]输出目录。
2、输入文件格式
支持标准BED格式,使用前 3 列chrom
, start
, end
。
支持MACS2 xls 格式,MAnorm 使用、chrom
和start
字段。end``summit
。但是 与MACS2 的broad mode 不兼容
3、输出文件
(1) <name1>vs<name2>_all_MAvalues.xls
这是 MAnorm 的主要输出结果,其中包含每个峰的 MA 值和归一化读取密度,来自两个样本的常见峰合并在一起。
- chr:染色体名称
- start:峰值的起始位置
- end:峰的结束位置
- 峰顶:峰顶位置(绝对位置)
- m_value:M value (log2 fold change) of normalized read densities under comparison
- a_value: A value (average signal strength) of normalized read densities under comparison
- p_value
- peak_group:表示峰来自哪里,是否为共同峰
- normalized_read_density_in_<名称1>
- normalized_read_density_in_<名称2>
(2)output_filters/
此文件夹包含 BED 格式的过滤的有偏/无偏峰
<name1>vs<name2>M_above<m_cutoff>_biased_peaks.bed
<name1>vs<name2>M_below-<m_cutoff>_biased_peaks.bed
<name1>vs<name2>_unbiased_peaks.bed
(3)output_tracks/
这些文件是 M 值、A 值和 P 值wiggle格式的基因组跟踪文件,可以将这些文件加载到基因组浏览器中进行可视化。
<name1>vs<name2>_M_values.wig
<name1>vs<name2>_A_values.wig
<name1>vs<name2>_P_values.wig
(4)output_figures/
该文件夹包含标准化前后的 MA 图和显示两个样本之间比例关系的散点图。
<name1>vs<name2>_read_density_on_common_peaks.pdf
<name1>vs<name2>_MA_plot_before_normalization.pdf
<name1>vs<name2>_MA_plot_after_normalization.pdf
<name1>vs<name2>_MA_plot_with_P_value.pdf