HiC质控-HiCUP
2020-08-06 本文已影响0人
jjjscuedu
HiC质控和fastqc有一些类似
HiCUP是一个处理由Hi-C和捕获Hi-C(Capture Hi-C,CHi-C)产生的测序数据的流程,它们是用于研究三维基因组组织的技术。流程比对数据到一个指定参考基因组,并去除可能阻碍随后分析的假象。HiCUP也产生一个易于解释,但详细的质控(quality control,QC)报告。(http://www.bioinformatics.babraham.ac.uk/projects/hicup/)
安装:
不用安装,直接下载就好。
运行:
1. 对参考基因组建立索引
bowtie2-build 1.fa,2.fa,...,MT.fa human_GRCh37
2. Using HiCUP Digester create a reference genome
hicup_digester --genome human_GRCh37 --re1 A^AGCTT,HindIII all.fa
注:genome后面的参数只能用字母,加上路径就不能运行

从运行结果,可以看出,这一步是根据限制性内切酶去全基因组扫描,然后分割。作为验证,可以很方面的看出gi|224589800|ref|NC_000001.10|染色体16007 开始的序列是AAGCTT,也就是限制酶的序列。

3. 生成配置文件
命令:../hicup --example
编辑hicup_example.conf文件

测试数据的配置文件如下:

4. 运行HiCPro
../hicup --config hicup.conf
运行结果,因为是同一个单位开发的,所以输出结果也类似:

比如这个是,比对的基本信息:

这是,需要过滤掉reads的统计:

这个是利用限制性酶切基因组后di-tag长度的分布:
