2021-02-15samtools使用学习1
samtools是一套与高通量测序数据相交互的程序。它由三个独立的存储库组成:
Samtools:读取/写入/编辑/索引/查看SAM / BAM / CRAM格式的文件
BCFtools:读取/写入BCF2 / VCF / gVCF文件以及调用/过滤/汇总SNP和短indel序列变体
HTSlib:一个用于读取/写入高通量测序数据的C语言库
Samtools和BCFtools在内部都会调用HTSlib,但这些源包包含它们自己的HTSlib副本,因此它们可以独立构建运行。
samtools – Sequence Alignment/Map (SAM) format 序列比对(SAM)格式的实用程序。是操作BAM格式文件比对的实用程序。它从SAM(序列对齐/映射)格式导入和导出,进行排序、合并和索引,并允许在任何区域快速检索读取。
Samtools被设计用来进行流程化操作。它将输入文件' -'视为标准输入(stdin),将输出文件' -'视为标准输出(stdout)。因此,可以将多个命令与Unix管道组合在一起。Samtools总是将警告warning和错误error消息输出到标准错误输出(stderr)。
如果BAM文件名以“ ftp://”或“ http://”开头,Samtools也能够在远程FTP或HTTP服务器上打开BAM(而非SAM)文件。 Samtools将检查当前工作目录中的索引文件,并在缺少索引时下载索引。 除非被要求,否则Samtools不会检索整个比对文件。
相关命令
samtools --version:显示samtools的版本号和版权信息以及samtools使用的重要库。 图片.pngsamtools --version-only:以机器可读的格式显示完整的samtools版本号。
图片.png
每个命令都有自己的手册页详细介绍,可以使用man samtools-view(或man samtools view)命令进行查看。下面是对一些命令的简要描述:
- view命令:可以作为一种文件格式(SAM、BAM、CRAM)转换的命令。