bioinfo100-第7题-读懂FastQC报告 Part I
2020-05-10 本文已影响0人
RachaelRiggs
Hello 大家好!
今天我们接着昨天的话题来继续进行与FastQC结果有关的提问。
我们昨天主要是针对FastQC结果中的boxplot进行了相关的探索,boxplot一般是认为FastQC几张必看的质控图之一。一般情况下FastQC的结果会包含下面几个图,而我们主要会看下图圈出来的几个。
image.png接下来的几天我们就把这些图来一个一个讨论清楚。
我们昨天讨论了“Per base sequence quality”,今天先来讨论 “Per base sequence content”
image1 image2问题:
1. 图1与图2中横坐标是什么意思?纵坐标是什么意思?
横轴代表1到150bp;纵轴代表ATCG在该bp的百分比。
2. 图1是1个正常的DNA 全基因组测序结果,为什么前面的几bp线是波动的?后面的线是平衡的?
根据Wason-Crick配对原则,A和T应该相等,G和C应该相等
但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现不平衡的情况
像这种情况
如果测序的得分很高,可以不进行trim起始部分的序列信息
如果测序得分很低,需要进行trim起始部分的序列信息
3. 在图1中你能不能看出一个恒定的量?(提示,同一物种间相同,不同物种间一般不同)如果能看出来,这个量是什么?数值大约是多少?
GC含量在同一物种中是一个恒定值。
图1中GC总体比例大约在42%(目测)