生物信息学习my RNA-seq

BBQ(生信基础问题11-12问-cutadapter):Cut

2019-01-03  本文已影响79人  liu_ll

接着上次的学习笔记,上次说到了fastqc的学习,如何去看fastqc生成的报告。一般来说,刚刚下机的数据是不能直接用于后续的分析。必须得去除接头和index等信息。此外,低质量的序列还需要去除?那么这次的学习笔记是主要集中在这几个问题:

1:如何获得adapter和barcode的序列?
2:利用什么软件可以去除这些信息?
3:如何去除低质量的数据?
4:如何利用代码来实现呢?

-------------------------------------分割线--------------------------------------------------------------
生物信息学100个基础问题 —— 第11题 使用cutadapt去除adapter
生物信息学100个基础问题 —— 第12题 trim与cutadapt 先用哪个?

bbq11-12的思考

其实主体还是利用fastqc进行质量评估,然后根据质量评估的信息。进行相应的质控。利用到的软件是cutadapter 和 fastx-toolkit,其实还有一些别的软件可以用,比如说trimmomatic或者是Trim Galore(亲测,都还是比较好用的)

Reference:

cutadapt 1.16 documentation-序列的过滤部分
高通量测序知乎专栏
FASTX-Toolkit - fastx_trimmer使用说明

PS: 我觉得软件都是通用的,话说FASTX-Toolkit也可以用来去adapter,为什么不用这个软件一起去了呢?

(先占个坑,欢迎小伙伴一起讨论!)

上一篇 下一篇

猜你喜欢

热点阅读