wdl入门及biowdl流程实践
安装 cromwell
WDL 是用cromwell 运行的,cromwell就是一个java包,下载下来就能用,不过需要java8, jdk 1.8 以上
查看java内核版本
javac -version
下载cromwell
cd /seq_dir/gitlab/WDL
wget https://github.com/broadinstitute/cromwell/releases/download/47/womtool-47.jar
wget https://github.com/broadinstitute/cromwell/releases/download/47/cromwell-47.jar
可以自己选不同的版本,最高版的有报错
womtool用来检查wdl程序是否合法
cromwell 运行wdl程序
从github biowdl找个流程 somatic-variantcalling做测试
1. 先把release zip下载下来,我选择wget zip
wget https://github.com/biowdl/somatic-variantcalling/archive/refs/tags/v2.2.1.zip
unzip v2.2.1.zip
发现还有两个目录tasks和scripts是软链接的,也下下来
wget https://github.com/biowdl/tasks/archive/refs/tags/v5.0.1.zip # task
wget https://github.com/biowdl/scripts/archive/refs/tags/v1.5.0.zip # script
unzip *.zip
cd somatic-variantcalling-2.2.1
rm -r tasks scripts
ln -s ../scripts-1.5.0 scripts
ln -s ../tasks-5.0.1 tasks
2. 他提供了test数据,先找个test数据跑一下
2.1 跑下mutect2,参考 tests/test_mutect2.yml里的命令行
java -jar ../../cromwell-47.jar run -o tests/cromwell_options.json -i tests/integration/Mutect2Paired.json mutect2.wdl
第一次会去自动下载镜像,比较慢,可以docker images 实时看下镜像
这些quay开头的就是
有两个json,顾名思义-o设置输出目录,-i提供输入文件,tese里的输入文件他都准备好,直接可以跑
跑完后在test-output 目录下就能看到vcf了
2.2 再跑一个somatic-variantcalling 参考 tests/test_somatic-variantcalling.yml
java -jar ../../cromwell-47.jar run -o tests/cromwell_options.json -i tests/integration/SomaticVariantcallingPairedConsensus.json somatic-variantcalling.wdl