如何确定基因拷贝数
2020-07-26 本文已影响0人
小潤澤
基因拷贝数概念
基因拷贝数是指某一种基因或某一段特定的DNA序列在单倍体基因组中出现的数目。也可以简单理解为基因组上某个片段重复出现的次数
目前来说,研究基因拷贝数大部分都是是通过实验的方法进行验证,比方说FISH,绝对荧光定量,或者southern。而在生物信息邻域,如果该物种已经有比较完整的基因组,那么我们可以对目标的基因做一个全基因组的blast,匹配到几个区段,那么就有几个拷贝。
但是,如果该物种研究的不是太清楚,那么上述方法就显得比较粗糙
文献解读
那么这次与大家分享的文献,是实验加生信分析综合来研究玉米中MATE1的基因拷贝数的,题目为:《PNAS: Copy Number Analysis in Maize Sheds Light on Tolerance for Acidic Soil》
这个故事是讲述玉米L53品系和Al237品系的MATE1基因的拷贝数来确定的,并且MATE1与AI处理有关
那么首先,作者利用FISH先确定MATE1基因的片段在染色体上的位置
当然,这只是大概的预估MATE1的位置,毕竟在染色体水平做FISH它的精度并不是很高
作者为了证明AI处理的确可以使得MATE1表达并且有明显的表型,作者利用GBS-seq分析MATE1的QTL情况,并且以不用AI处理作为control
那么进行AI处理后,红色圆圈是利用广义线性模型对MATE1的GBS数据相关SNP与性状的关联性(左边y轴);实心三角表示AI处理的样本,空心三角表示对照;而虚线部分表示MATE1的位置,小图里面的灰色柱子表示MATE1与该性状相关的loci,那么显然在MATE1区段上,与该性状更密切相关。
因此,如果对每一个MATE1的copy,在这些区段上,相同的SNP与该性状相关性都相似,那么说明这些copy发挥着相同的功能。
那么接下来,作者需要了解,这两个品系究竟有几个copies,以及它们具体的排列方式
作者利用BAC测序(大片段插入载体,筛选目标基因后进行测序),因此我们可以得知,Al237品系中MATE1有三个copies,而L53只有一个
Al237品系
那么,如果某一个品系的某一个基因有三个copies,另一个品系的该基因只有一个copy;那么用同样的引物去扩该基因,那么拷贝数越多,它的底物浓度就越多,那么势必会导致三个copies品系的qPCR荧光信号(3个copies大于1个copies)会更高一些
因此,利用绝对定量PCR可以确定,在某种处理下,使两个品系的MATE1均表达,那么显然有三个拷贝的qPCR荧光信号会更高一些