VFDB毒力因子数据库
2022-01-12 本文已影响0人
胡童远
主页:http://www.mgc.ac.cn/VFs/main.htm
下载:http://www.mgc.ac.cn/VFs/download.htm
注释信息:
http://www.mgc.ac.cn/VFs/Down/VFs.xls.gz
属内物种比较毒力组:
http://www.mgc.ac.cn/VFs/Down/Comparative_tables_from_VFDB.tar.gz
核心序列集:
http://www.mgc.ac.cn/VFs/Down/VFDB_setA_nt.fas.gz
http://www.mgc.ac.cn/VFs/Down/VFDB_setA_pro.fas.gz
全序列集:
http://www.mgc.ac.cn/VFs/Down/VFDB_setB_nt.fas.gz
http://www.mgc.ac.cn/VFs/Down/VFDB_setB_pro.fas.gz
使用
下载蛋白全序列集,解压,重命名,diamond建库,比对
# diamond建库
diamond makedb -p 2 \
--in VFDB_setB_pro.fasta \
--db VFDB_setB_pro.dmnd
# diamond比对
diamond blastp \
--db VFDB_setB_pro.dmnd \
--query genome.faa \
-e 1e-3 --outfmt 6 --more-sensitive --max-target-seqs 1 \
--threads 8 --quiet \
--out genome_vfdb.txt
# --id minimum identity% to report an alignment
# --query-cover minimum query cover% to report an alignment
比对结果
AF01-22_00031 VFG000442(gb|NP_490501) 34.0 156 87 3 90 245
AF01-22_00049 VFG029608(gb|WP_042510611) 27.4 343 225 10 23
AF01-22_00058 VFG017683(gb|YP_005921788) 37.4 235 143 4 356
AF01-22_00060 VFG021557(gb|WP_001090556) 39.3 191 107 5 1
比对结果每列信息
1. qseqid | query sequence id
2. sseqid | subject sequence id
3. pident | percentage of identical matches
4. length | alignment length
5. mismatch | number of mismatches
6. gapopen | number of gap openings
7. q start | start of alignment in query
8. q end | end of alignment in query
9. s start | start of alignment in subject
10. s end | end of alignment in subject
11. evalue
12. bitscore