Jbrowser

使用JBrowser配置参考基因组和基因注释信息

2019-05-07  本文已影响0人  Davey1220

准备参考基因组hg19及其基因的注释文件

可以在UCSC网站的官网上下载hg19参考基因组的序列和基因注释文件 image.png

使用JBrowser自带的脚本导入参考基因组序列

cd /var/www/html/JBrowse-1.16.4/
mkdir data && cd data  #新建一个data文件夹用于存放不同的基因组
mkdir hg19 && cd hg19  #新建hg19文件夹用于存放hg19参考基因组
# 使用gffread将gtf格式基因注释文件转换为gff3格式文件
/data/public/software/cufflinks-2.2.1/gffread hg19.gencode.v14.annotation.gtf -o- < hg19.gencode.v14.annotation.gff3
# 使用脚本prepare-refseqs.pl导入hg19参考基因组
../../bin/prepare-refseqs.pl --fasta hg19.fa --out ./

导入参考基因组后,会在当前文件夹中生成一个seq文件夹和trackList.jsontracks.conf两个配置文件。

使用JBrowser自带的脚本导入基因注释信息

目前JBrowser对基因的注释信息提供了两种feature的展示形式:HTMLfeaturesCanvasFeatures。其中HTMLfeatures暂时只支持gff3格式文件,而CanvasFeatures可以同时支持gtf和gff3格式,但是它是临时读取文件的,在browser中显示的速度会比较慢。

# 查看使用说明信息
../../bin/flatfile-to-json.pl -h
Usage:
      flatfile-to-json.pl                                                         \
          ( --gff <GFF3 file> | --bed <BED file> | --gbk <GenBank file> )         \
          --trackLabel <track identifier>                                         \
          [ --trackType <JS Class> ]                                              \
          [ --out <output directory> ]                                            \
          [ --key <human-readable track name> ]                                   \
          [ --className <CSS class name for displaying features> ]                \
          [ --urltemplate "http://example.com/idlookup?id={id}" ]                 \
          [ --arrowheadClass <CSS class> ]                                        \
          [ --noSubfeatures ]                                                     \
          [ --subfeatureClasses '{ JSON-format subfeature class map }' ]          \
          [ --clientConfig '{ JSON-format style configuration for this track }' ] \
          [ --config '{ JSON-format extra configuration for this track }' ]       \
          [ --thinType <BAM -thin_type> ]                                         \
          [ --thicktype <BAM -thick_type>]                                        \
          [ --type <feature types to process> ]                                   \
          [ --nclChunk <chunk size for generated NCLs> ]                          \
          [ --compress ]                                                          \
          [ --sortMem <memory in bytes to use for sorting> ]                      \
          [ --maxLookback <maximum number of features to buffer in gff3 files> ]  \
          [ --nameAttributes "name,alias,id" ]                                    \
# 使用flatfile-to-json.pl脚本导入基因注释信息
../../bin/flatfile-to-json.pl --gff hg19.gencode.v14.annotation.gff3 --type mRNA --trackLabel GeneAnnot --key 'GFF3-mRNA-HTMLfeatures' --className transcript --getSubfeatures --subfeatureClasses '{"CDS": "transcript-CDS"}' --arrowheadClass arrowhead --autocomplete all --metadata '{"category" : "GeneAnnotation"}' --out ./

导入基因的注释信息后,会在当前文件夹下生成一个tracks文件夹,并将相应基因注释的配置信息写入到trackList.json配置文件中。

[ tracks . hg19-GFF3 ]
storeClass = JBrowse/Store/SeqFeature/GFF3
urlTemplate = ./hg19.gencode.v14.annotation.gff3
type = CanvasFeatures
category = Gene
key = GFF3-hg19-CanvasFeatures

(2) 导入gtf文件
在./tracks.conf文件中加入以下配置信息:

[ tracks . hg19-GTF]
storeClass = JBrowse/Store/SeqFeature/GTF
urlTemplate = ./hg19.gencode.v14.annotation.gtf
type = CanvasFeatures
category = Gene
key = GTF-hg19-CanvasFeatures
style.label = transcript_id,gene_id

在浏览器中展示hg19参考基因组及其基因注释信息

打开google浏览器,在里面直接输入服务器对应的ip地址和文件路径即可查看相应基因组的相关信息
http://xxx.xxx.xxx.xx/JBrowse-1.16.4/index.html?data=data/hg19/

image.png
上一篇下一篇

猜你喜欢

热点阅读