三维基因组HiC学习

HiC质控-HiCUP

2020-08-06  本文已影响0人  jjjscuedu

HiC质控和fastqc有一些类似

HiCUP是一个处理由Hi-C和捕获Hi-C(Capture Hi-C,CHi-C)产生的测序数据的流程,它们是用于研究三维基因组组织的技术。流程比对数据到一个指定参考基因组,并去除可能阻碍随后分析的假象。HiCUP也产生一个易于解释,但详细的质控(quality control,QC)报告。(http://www.bioinformatics.babraham.ac.uk/projects/hicup/)

安装:

不用安装,直接下载就好。

运行:

1. 对参考基因组建立索引

bowtie2-build 1.fa,2.fa,...,MT.fa human_GRCh37

2. Using HiCUP Digester create a reference genome

hicup_digester --genome human_GRCh37 --re1 A^AGCTT,HindIII all.fa

注:genome后面的参数只能用字母,加上路径就不能运行

从运行结果,可以看出,这一步是根据限制性内切酶去全基因组扫描,然后分割。作为验证,可以很方面的看出gi|224589800|ref|NC_000001.10|染色体16007 开始的序列是AAGCTT,也就是限制酶的序列。

3. 生成配置文件

命令:../hicup --example

编辑hicup_example.conf文件

测试数据的配置文件如下:

4. 运行HiCPro

../hicup --config hicup.conf

运行结果,因为是同一个单位开发的,所以输出结果也类似:

比如这个是,比对的基本信息:

这是,需要过滤掉reads的统计:

这个是利用限制性酶切基因组后di-tag长度的分布:

上一篇 下一篇

猜你喜欢

热点阅读