生物信息学与算法

GATK的初步安装

2019-04-11  本文已影响20人  三刀之流

GATK是GenomeAnalysisToolkit的简称,是一系列用于分析高通量测序后基因突变的工具集合。它提供一种工作流程,称作“ GATK Best Practices”。

系统要求

系统要求linux或Mac OS,不支持Windows系统。需要java 1.8环境。当然有些工具是需要R和Python的,所以python 2.6是标配了。

GATK 下载

我们可以到这个网址点击下载最新版的GATKhttps://software.broadinstitute.org/gatk/download/。下载完成后我们可以得到zip压缩文件,unzip语句即可解压。文件夹里可以得到四个文件:


两个jar文件分别是本地电脑使用(local结尾)和spark服务器(spark结尾)使用的。

安装

其实这个不太需要特殊安装,只需要把其放到程序变量里即可。

测试是否安装成功

测试是否安装成功的自然也是help。


后面我们还需要下载其配套的注释文件和基因组才可以按照其流程进行分析。

GATK关键的几个网址:

Quick Start Guide:https://software.broadinstitute.org/gatk/documentation/quickstart

Introduction to the GATK Best Practises:https://software.broadinstitute.org/gatk/best-practices/

Resource Bundle:https://software.broadinstitute.org/gatk/download/bundle

what's in the resource bundle and how can I get it? https://gatkforums.broadinstitute.org/gatk/discussion/1213/whats-in-the-resource-bundle-and-how-can-i-get-it
bundle:ftp://ftp.broadinstitute.org/bundle/
`

上一篇 下一篇

猜你喜欢

热点阅读