生信入门之Linux基础与R基础基因组组装

gget——高效的基因组数据库查询工具

2022-05-27  本文已影响0人  嘿嘿嘿嘿哈

最近在bioRxiv上发布的一篇文献介绍了gget——能高效进行基因组数据库查询的工具。
使用gget能够以命令行的形式查询或下载基因组数据库的相关信息,甚至能进行BLAST、基因富集、序列比对等等操作,再也不用费心去各种网页中一级级辛苦查找啦。
下面学习一下其具体使用方法。

Efficient querying of genomic databases for single-cell RNA-seq with gget

文献地址:Efficient querying of genomic databases for single-cell RNA-seq with gget | bioRxiv
github地址: https://github.com/pachterlab/gget

以下资料参考自gget官方手册:GitHub - pachterlab/gget_examples: Examples for gget


1. 基本介绍

gget是一个免费的开源命令行工具和Python包,支持对基因组数据库的高效查询。
gget由一组独立但可互操作的模块组成,每个模块都用于在一行代码中实现一种类型的数据库查询。目前由以下9个模块组成:
gget refgget searchgget searchgget infogget seqgget blastgget blatgget musclegget enrichrgget archs4

gget_overview.png

2. 安装

pip install gget

或用conda进行安装:

conda install -c bioconda gget

For use in Jupyter Lab / Google Colab:

import gget

3. 各模块功能与使用示例

① gget ref

# 获取最新的人的所有参考基因组和注释(DNA、cDNA、cds、gtf等)的FTP地址
gget ref -s homo_sapiens
# 获取特定版本的人的参考基因组与注释的FTP地址
gget ref -s homo_sapiens -w gtf dna -r 103

② gget search

gget search -sw gaba gamma-aminobutyric -s homo_sapiens  -o results.csv

③ gget info

gget info -id ENSG00000034713 ENSG00000104853 ENSG00000170296 -e -o results.csv

④ gget seq

gget seq -id ENSG00000034713 ENSG00000104853 ENSG00000170296 -o results.fa

⑤ gget blast

## 先下载lxml
conda install -y lxml
gget blast -seq MKWMFKEDHSLEHRCVESAKIRAKYPDRVPVIVEKVSGSQIVDIDKRKYLVPSDITVAQFMWIIRKRIQLPSEKAIFLFVDKTVPQSR -o results.csv
## 用fa或txt文件进行BLAST
gget blast -seq fasta.fa -o results.csv

⑥ gget blat

gget blat -seq MKWMFKEDHSLEHRCVESAKIRAKYPDRVPVIVEKVSGSQIVDIDKRKYLVPSDITVAQFMWIIRKRIQLPSEKAIFLFVDKTVPQSR -a taeGut2 -o results.csv

⑦ gget muscle

gget muscle -fa fasta.fa -o results.afa

⑧ gget enrichr

gget enrichr -g ACE2 AGT AGTR1 -db ontology -o rich.csv

⑨ gget archs4

##查找与基因ACE2最相关的基因
gget archs4 -g ACE2  -o  ACE2.csv
##查找基因ACE2的组织表达图谱
gget archs4 -g ACE2 -w tissue  -o  ACE2_tissue.csv


通过以上学习实践可以发现,gget整合了我们常用的查询基因组数据库的各项功能,能够以简单易学的命令行形式进行多种多样的操作,对于熟悉命令行操作的使用人员可以说是很棒的一个辅助工具了。
最后感谢生信技能树Jimmy老师,让我了解学习到了gget工具的使用( ̄▽ ̄)

上一篇下一篇

猜你喜欢

热点阅读