札记03-bam/sam
写于 20191027,书写背景:理论知识欠缺;
sam格式 看《NGS生物信息分析V6.2》158-159;
信息来源于网络和书本
1: bam/sam是什么?
SAM : the Sequence Alignment/Map format,摘自:https://genome.sph.umich.edu/wiki/SAM
BAM:Binary Alignment/Map , BAM就是SAM的二进制文件(B取自binary);摘自:https://www.plob.org/article/7234.html;https://www.jianshu.com/p/0a6111f9a183
2:产生背景
一个通用的格式可以提供一个很好的接口用于链接比对与下游分析(组装,变异等,基因分型等),摘自:http://www.biotrainee.com/thread-2704-1-1.html
分析什么阶段会产生bam/sam文件?
摘自:https://mp.weixin.qq.com/s/OyJTpOCvE768LglieaDd3A
3:bam/sam文件格式
摘自:https://mp.weixin.qq.com/s/OvdLJ7GRuimmAnF1b6e9eA
摘自:https://www.jianshu.com/p/240bffd7cf00
bam文件的flag其实是很重要的信息:每个flag用一个数字表示,对应一种比对的情况;flag
4:bam/sam文件 存储信息
比对软件 将reads比对到参考基因组上,并且能并行运行。
5:比对软件:摘自书本158页
Illumina/Solexa, AB/SOLiD and Roche/454测序 : short reads 进行比对的软件 Bowtie 、BWA、HISAT、和 Tophat;
Pacbio测序:long reads 进行比对的软件 Blasr;
进一步拓展:介绍5个比对的软件,https://mp.weixin.qq.com/s/YI8QzAaAEWubCe1JxXEL1w
6:bam/sam 转换
BAM==>SAM:samtools view -h -o out.sam out.bam
SAM==>BAM:samtools view -bS out.sam >out.bam
摘自:http://blog.sciencenet.cn/blog-981687-834290.html
摘自:https://www.jianshu.com/p/240bffd7cf00
偶然发现一个作图很好的网址:http://www.bioinformatics.com.cn/?/topic/SAM