小教程收藏

「生信」Juicer —— For Hi-C Data Proc

2019-07-05  本文已影响7人  bioinfo_boy

目录

  • 写在前面
  • juicer_tools.jar使用说明
  • straw介绍

写在前面

juicer_tools.jar使用说明

概述

Juicer_tools

工具的使用 → juicer_tools.jar

Arrowhead

链接: Arrowhead

arrowhead [-c chromosome(s)] [-m matrix size] [-r resolution] 
        [-k normalization (NONE/VC/VC_SQRT/KR)] <HiC file> 
        <output_file> [feature_list] [control_list]
参数 描述
必须参数 ---
<HiC file> Juicer生成的.hic文件
<output_file> contact domain文件, 可导入Juicebox 通过2D annotation进行可视化
可选参数 ---
-c 染色体, 多个染色体写法chr1,chr2,chr3, 或者是1,2,3
-m 沿着对角线移动的窗口, 必须为偶数,移动步距是m/2, 默认为2000
-r 查找的分辨率, 默认为10k, 设置值取决于.hic文件
-k 选择标准化的方式, <NONE/VC/VC_SQRT/KR>, 通常选KR
chromosome1    x1    x2    chromosome2    y1    y2    color    corner_score    Uvar    Lvar    Usign    Lsign

HiCCUPS(方法二)

这里介绍'阉割CPU版本, 链接: CPU-HiCCUPS

hiccups [-m matrixSize] [-c chromosome(s)] [-r resolution(s)] 
        [-k normalization (NONE/VC/VC_SQRT/KR)] [-f fdr] 
        [-p peak width] [-i window] [-t thresholds] 
        [-d centroid distances] <HiC file> <outputDirectory> [specified_loop_list]
参数 描述
必须参数 ---
--cpu CPU版本必选
<HiC file> MAPQ>30的.hic文件
<outputDirectory> 计算的结果文件和中间文件
可选参数 ---
--restrict 使用GPU版本跑CPU版本的参数信息, 用于比较两者的差异
[specified_loop_list] 位置的可选参数, 对应于merge的loop文件, 用于返回特定loop
-m 我理解为GPU并行的线程数, 不会影响结果, 数值越大, 速度越快, 独显可设置500, 100 或2048, 集成选卡最好不要超过100
-c 染色体, 多个染色体写法chr1,chr2,chr3或者1,2,3
-r 分辨率, 多个分辨率用','隔开, 不同的分辨率再设置其他参数时也需用','隔开
-k 选择标准化的方式, <NONE/VC/VC_SQRT/KR>, 通常选KR
-f FDRvalues
-p 峰的宽度
-i 窗口的宽度
-d Distances used for merging nearby pixels to a centroid
-t 四个用逗号隔开的参数, 用于不同分辨率的loop合并的门槛

MotifFinder

Hiccupsdiff

hiccupsdiff [-m matrixSize] [-k normalization (NONE/VC/VC_SQRT/KR)] [-c chromosome(s)] [-f fdr] [-p peak width] [-i window] [-t thresholds] [-d centroid distances] <firstHicFile> <secondHicFile> <firstLoopList> <secondLoopList> <outputDirectory>

APA

apa [-n minval] [-x maxval] [-w window] [-r resolution(s)] [-c chromosomes]
        [-k NONE/VC/VC_SQRT/KR] [-q corner_width] [-e include_inter_chr] [-u     
save_all_data]
        <hicFile(s)> <PeaksFile> <SaveFolder>
参数 描述
必须参数 ---
<hicFile(s)> .hic文件
<PeaksFile> loop文件
<SaveFolder 保存的目录
可选参数 ---
-n 对角线上peaks的最小距离, 用于过滤距离近的峰, 跟提供的分辨率有关系, 例如: -n 30, 分辨率5Kb, 筛选条件为 30*(5000/sqit(2))
-x 对角线上peaks的最大距离, 用于过滤距离近的峰, 跟提供的分辨率有关系, 例如: -n 30, 分辨率5Kb, 筛选条件为 30*(5000/sqit(2))
-w 特殊loop聚合的窗口宽度
-r 分辨率, 多重分辨率可以写成5000,10000
-c APA分析的染色体, 多个染色体写法chr1,chr2,chr3或者1,2,3
-k 选择标准化的方式, <NONE/VC/VC_SQRT/KR>, 通常选KR
-q 对应于-r, 在各分辨率下边角区域的宽度
-e 用于计算染色体间的APA, 作者表示, 文献中APA不是对染色体间设计的, 使用需谨慎
-u 对每条染色体保存plots
-n 30 
-x (infinity) 
-w 10 
-r 25000,10000,5000
-q 6,6,3
-c (all chromosomes) 
-k KR

Pearsons

pearsons <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr> <BP/FRAG> <binsize> [outfile]  
java -jar juicer_tools.jar pearsons NONE HIC001.hic X BP 25000 pearsons_25Kb.txt

Eigenvector

eigenvector <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr> <BP/FRAG> <binsize> [outfile]
java -jar juicer_tools.jar eigenvector VC HIC001.hic X BP 5000 eigen.txt

Dump

是Juicebox的命令行提取工具, 如果使用Python, R或C++, 可以通过straw
模块处理.hic文件

juicebox dump <observed/oe> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr1>[:x1:x2] <chr2>[:y1:y2] <BP/FRAG> <binsize> [outfile]
         dump <norm/expected> <NONE/VC/VC_SQRT/KR> <hicFile(s)> <chr> <BP/FRAG> <binsize> [outfile]
         dump <loops/domains> <hicFile URL> [outfile]

Pre

straw介绍

是各平台接口

Python

python3 -m pip install hic-straw

C++&R

~
上一篇 下一篇

猜你喜欢

热点阅读