Bioinformatics单细胞测序RNASeq 数据分析

基础知识复习之比对

2018-11-30  本文已影响11人  刘小泽

刘小泽写于18.11.30

一般我们得到原始数据、质控过滤后,要么进行比对,要么序列拼接。序列比对的话可以选择参考基因组、参考转录本,目的就是看看测序的reads分布在什么位置,然后根据这个去找变异或者看表达量多少;拼接的话可以拼接转录本或者构建基因组

序列比对

就是将测序reads重新定位到基因组/转录组上,又叫mapping

先说下特点

和平常我们常用的blast同源比对不同,这里的序列比对主要指高通量测序得到的短序列,这种序列主要有这几个特点:

比对的结果

测序是个麻烦活,得到的结果又各自千差万别,因此比对的结果也有好多种情况,先简单就一对PE reads的比对情况来了解:

PE reads比对说明

上面说的Pair end比对就是:两条reads同时比对到同一序列,当然,除了PE reads比对外,还有single end(SE)比对,包括了:

另外两条reads可能一条比对上的也没有,可能由于reads中错配太多或者两条reads同源性比较低

序列比对的应用

应用一:与自身拼接结果进行比对

比如自身的基因组、基因集

应用二:与参考进行比对

比如参考基因组、基因集、公共数据库等

通过比对,我们可以得到一些具体的有用信息:

高、低覆盖区

比对软件

常用算法

比对过程

最常用的BWA软件

顾名思义,就是采用bwt算法的aligner工具,输出sam/bam,目前比对最常用

再看看一些注意点


欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到Bioplanet520@outlook.com

Welcome to our bioinfoplanet!
上一篇下一篇

猜你喜欢

热点阅读