NGS中的唯一分子标记策略(UMI strategy in NG
什么是唯一分子标记?
唯一分子标记(UMI)是一种分子条形码,可以在测序过程中错误校正,提高准确性。
这些分子条形码均为短序列,可特异性的标记样本文库中的每个分子。UMI可用于各种测序应用,许多是与DNA和cDNA的PCR重复相关的应用。RNA-seq基因表达分析和其他定量测序方法也可以采用UMI来去除重复。UMI被用于二代测序和三代测序[1]。
唯一分子标记的优势
UMI测序可以降低假阳性变异检出的概率,同时能提高变异检测的灵敏度[2-4]。由于起始材料中的每个核酸都有唯一的分子条形码,因此,生物信息学软件可以高度精确地过滤出重复的read和PCR错误,报告唯一read,从而在最终数据分析之前消除已识别的错误。
UMI的工作原理
UMI会在给定样本文库中的每个分子上添加一个唯一条形码。通过在每个原始DNA片段上添加单独的条形码,可以将原始样本中的变异等位基因(真实变异)与文库制备、靶向富集或测序过程中引入的错误区分开。
![](https://img.haomeiwen.com/i19555511/7e2b9986ac80fe19.png)
常见UMI策略
- Illumina策略[5]
UMI在insert size区域内,测序使用常规的读长模式就行。
![](https://img.haomeiwen.com/i19555511/c6a3a40925a70afb.png)
- IDT策略[6]
UMI加在i7 index和P7序列之间,测序时读长模式需要调整,测i7 index需要增加额外9个cycle。
![](https://img.haomeiwen.com/i19555511/1d9e96b0f7934856.png)
- Swift策略[7]
UMI替代了i5 index,测序使用常规的读长模式就行。
![](https://img.haomeiwen.com/i19555511/deb2602355c07e4e.png)
参考资料
-
Karst, S.M., Ziels, R.M., Kirkegaard, R.H. et al. High-accuracy long-read amplicon sequences using unique molecular identifiers with Nanopore or PacBio sequencing. Nat Methods 18, 165–169 (2021).
-
MacConaill, L.E., Burns, R.T., Nag, A. et al. Unique, dual-indexed sequencing adapters with UMIs effectively eliminate index cross-talk and significantly improve sensitivity of massively parallel sequencing. BMC Genomics 19, 30 (2018).