生信分析过程中的一些小trick2022

SAM/BAM的CIGAR难点

2020-04-06  本文已影响0人  刘小泽

刘小泽写于2020.4.6
记录一个小知识点,比对后SAM/BAM的CIGAR这一列中的含义,重点是soft clipping 和 hard clipping的理解

首先了解SAM/BAM中的CIGAR含义

看这篇:再次理解SAM/BAM操作

根据sam的帮助文档:http://samtools.sourceforge.net/SAM1.pdf

op    Description
M    Alignment match (can be a sequence match or mismatch
I    Insertion to the reference
D    Deletion from the reference
N    Skipped region from the reference
S    Soft clip on the read (clipped sequence present in <seq>)
H    Hard clip on the read (clipped sequence NOT present in <seq>)
P    Padding (silent deletion from the padded reference sequence)

然后来看什么是clipped alignment和spliced alignment

参考:https://davetang.org/wiki/tiki-index.php?page=SAM

然后clipped alignment有两种形式

分为soft和hard(在SAM/BAM的CIGAR列分别用“S”和“H”表示),它们很相似,不同是:

来自:https://www.biostars.org/p/119537/

来自:https://www.biostars.org/p/109333/

那么什么时候标记Hard clip,什么时候标记Soft clip呢?

参考:https://www.biostars.org/p/310722/https://www.biostars.org/p/109333/


欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!
上一篇 下一篇

猜你喜欢

热点阅读