生信分析

bioinfo100-第7题-读懂FastQC报告 Part I

2020-05-10  本文已影响0人  RachaelRiggs

zhn-blog
mhw-zh

Hello 大家好!

今天我们接着昨天的话题来继续进行与FastQC结果有关的提问。

我们昨天主要是针对FastQC结果中的boxplot进行了相关的探索,boxplot一般是认为FastQC几张必看的质控图之一。一般情况下FastQC的结果会包含下面几个图,而我们主要会看下图圈出来的几个。

image.png

接下来的几天我们就把这些图来一个一个讨论清楚。

我们昨天讨论了“Per base sequence quality”,今天先来讨论 “Per base sequence content”

image1 image2

问题:

1. 图1与图2中横坐标是什么意思?纵坐标是什么意思?

横轴代表1到150bp;纵轴代表ATCG在该bp的百分比。

2. 图1是1个正常的DNA 全基因组测序结果,为什么前面的几bp线是波动的?后面的线是平衡的?

根据Wason-Crick配对原则,A和T应该相等,G和C应该相等

但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现不平衡的情况

像这种情况

如果测序的得分很高,可以不进行trim起始部分的序列信息

如果测序得分很低,需要进行trim起始部分的序列信息

3. 在图1中你能不能看出一个恒定的量?(提示,同一物种间相同,不同物种间一般不同)如果能看出来,这个量是什么?数值大约是多少?

GC含量在同一物种中是一个恒定值。

图1中GC总体比例大约在42%(目测)

上一篇下一篇

猜你喜欢

热点阅读