在开始前定一个主基调
对于测序大家应该都不陌生,我所研究的课题主要是通过二代测序获得基因组数据进而进行分析。
概述一下
二代测序技术(next generation sequencing,NGS),又称为高通量测序技术(high-throughput sequencing,HTS)或深度测序(deep sequencing),通过一次对几十万到几百万条核酸分子进行序列测定,进而对一个物种的转录组和基因组进行细致全貌的分析。
一般我们对人类基因组的研究策略主要是三个:
全基因组重测序(whole genome re-sequencing,WGS)
全外显子组重测序(whole exome re-sequencing,WES)
目标区域测序(target region re-sequencing,TR)
对于这三个策略如何应用,这完全看课题需要,没有人说过这三个策略必须分开进行,实际上目前很多课题组在进行研究的时候,都会先分析WES和panel的数据,再考虑进行WGS的测序分析,也有些课题组通过panel筛选病例,再进行WES或WGS的分析。以上只是两个简单的思路,适用于不同的课题需求。那到底怎么去选取研究策略,还是根据课题的需求,这充分说明了,课题设计的重要性,从我踩过的坑来看,一个好的课题设计,能让你后续的分析少碰很多壁,而且我觉得课题是循序渐进的,具体怎么去做要根据预实验好好的验证。
而我的课题就是属于没有被好好设计的那种,那么我的研究对象主要是(全是)WGS的数据了,既然这已经改变不了了,那就好好分析,以找出差异基因,争取早日脱离苦海。
那么之后我要分析的内容其实是以WGS的数据为对象,当然,这并没有太大影响,因为很多分析是大同小异的。
WGS分析流程这里贴一张某测序公司培训时给的WGS数据分析流程,我的样本测序就是交给这家公司来完成的,这张照片比较早,大概是2018年四月时候的培训,不知道这家公司现在还是不是这么分析的,但这并不重要,目前大体的分析流程大同小异,一般发表的文章也会提供分析方法,也是值得大家借鉴的。
而我后面的分析方法和流程与这里也是有差别的,但我为什么没有贴我自己的流程图呢,主要是因为我的流程细节部分还在不断的修改过程中,我后面的文章会按照我的流程进行一步步的介绍,也会抛出我遇到的问题,希望能得到大家的指点,大家共同交流,批评指正!!!