WGS实战篇

WGS的实战笔记(一)

2018-11-19  本文已影响3人  liu_ll

前言:开始WGS的分析的学习,记录下学习的过程了,说实话,在这之前我是跑过WGS的流程的,但是每步感觉跑的都不是很稳当,踏实。导致自己在后期的学习还是会出现各种漏洞。所以在学习的过程中及时的markdown很重要!

话不多说,开始学习,首先我是拿到了两个WGS的数据,分别是 测序的结果一
测序的结果二

PS:因为在之前的分析过程中(一)公共数据库和公司测的数据库它们都是双端测序。(二)但是不同的是他们的数据大小不一样,如L001-R1,L001-R2都是一端测的结果,但是结果太大了分成了两个文件。但是我这个公司给我的结果不是这样的。目测估计测序的深度没有那么深。


数据来自公共数据库
1:拿到了数据之后,第一步是可以看看测序的质量。
Fastqc是一个非常好用的软件,看一直接看测序的质量结果,一般fastqc可以在进行质控前后都看看。我这里为了偷懒直接用了Fastqc看了质控后的结果。
2:拿到原始的数据之后,可以直接用质控软件进行过滤,我这里用的是trimmomatic(怎么下和安装,我这里就不贴了,可以直接去百度呀)
java -jar /asnas/sunyl_group/liull/software/Trimmomatic-0.36/trimmomatic-0.36.jar PE -phred33 /asnas/sunyl_group/liull/TNBC_test/Rawdata/BCA0106-2/BCA0106-2_R1.fq.gz  /asnas/sunyl_group/liull/TNBC_test/Rawdata/BCA0106-2/BCA0106-2_R2.fq.gz  output_BCA0106-2_R1_paired.fq.gz output_BCA0106-2_R1_unpaired.fq.gz output_BCA0106-2_Rnas2_paired.fq.gz output_BCA0106-2_R2_unpaired.fq.gz ILLUMINACLIP:/asnas/sunyl_group/liull/software/Trimmomatic-0.36/adapters/TruSeq3-PE.fa:2:30:10 LEADING:5 TRAILING:5 SLIDINGWINDOW:4:20 MINLEN:36

这里贴上代码注解,
(1)PE是双端测序(pair end)
(2)-phred 33 是碱基的质量字符和质量得分的一种表达形式。这两年公司测序一般用的是phred 33
(3)接下来是我测序的数据路径
(4)paired和unpaired的结果
(5)adapter的信息,这个在trimmomatic的adapter文件里有,自己可以手动加载一下
(6)后面的参数,切除adapter序列。参数后面分别接adapter序列的fasta文件:允许的最大mismatch数:palindrome模式下匹配碱基数阈值:simple模式下的匹配碱基数阈值。(一般都是参考网上的大神代码,我这里有微调。)

在trimmomatic结束之后,可以看看结果,显示91.74%剩下来

trimmomantic的结果
接下来可以用fastqc看看质控完之后的结果是怎么样
(布吉岛为什么网抽了。。。。。。上传不了图片)
这里贴一个参考的网站 https://www.jianshu.com/p/a1eb03d63083 这个写的挺好的给作者点赞
上一篇 下一篇

猜你喜欢

热点阅读