生信必备生物知识RNA-seq

生物学一些术语

2019-01-10  本文已影响10人  Thinkando

1. 在全基因组关联研究中常用的术语

  1. 等位基因:在基因或染色体座位上不同的DNA序列。
  2. 候选基因:根据基因的已知生物学和/或其生理性产物,或者该基因位置与一个已知的连
    锁区域邻近,推测该基因可以影响某一复杂性状/表型的出现。
  3. 拷贝数变异:基因组序列中大约1 kb到3 Mb大小的DNA片段缺失或被重复次数不同。
  4. 错误检出率(阳性结果错误率):实际为假阳性的关联结果的比率。
  5. 假阳性报告率:给定一个统计学显著性结论时零假设成立的概率。

6.功能研究:研究一个遗传变异在导致疾病或性状机制中起到的作用。
7.基因-环境相互作用:在一定环境因素下对基因-疾病关联的影响。
8.全基因组关联研究:所有对整个人类基因组上任何基因变异的研究,旨在寻找基因与疾 病中可观察表型出现或缺如之间的相关性,通常指的是研究基因的标记密度为10万或更多,用来代表人类基因组中大部分的变异。
9.分型得率:样本或SNPs中特定的等位基因SNP能够通过基因分型方法被可靠地辨别的比 率。

  1. 单倍型:一组与基因或标记邻近的特定等位基因,倾向于被一起传递给下一代。
  2. 国际人类基因组单体型图计划:全基因组数据库包含多个祖先人群样本中基因共同序列
    变异模型。
  3. 哈迪-温伯格平衡/遗传平衡定律:2个等位基因(频率p和q)在人群中的分布情况是稳定
    的代代相传并且基因型频率来说分别是主要等位基因纯合子,杂合子,和最小等位
    基因等位基因纯合子对应为p2, 2pq 和q2。
  4. 连锁不平衡:相邻的两个等位基因之间在一条染色体上相互关联,使它们一起传递给下
    一代的机会比预期要多。

14.孟德尔遗传疾病:疾病几乎完全由单个基因所致,例如囊性纤维化病或亨丁顿舞蹈症,
这些疾病表现仅有1(隐性)或2(显性)和3可能的基因型群体。
15.次要等位基因:在研究群体中二态性等位基因中频率较小的一个等位基因。 次要等位基因频率:两个等位基因中比例较少的一个(人的每条常染色体基因座有两个
等位基因),它的频率在小于1%到小于50%之间。
16.微弱效应:基因变异体和疾病或表型之间的关联具有显著统计意义,但是优势比的值很 小(通常<1.5)。

  1. 非孟德尔遗传病(或常见,或复杂疾病):此表型是由多种基因和环境影响引起,不表
    现为孟德尔遗传模式。
  2. 非同义SNP:一个多态性导致蛋白质氨基酸序列的改变(因此可能影响蛋白质的功能)。
    19.平台:阵列或芯片,在此上进行高通量的基因分型。
  3. 多态性:一个基因或位点具有多样的等位基因形式。
  4. 多态性通常表示最小等位基因频率 至少为1%。
  5. 人群归因危险度:总人群发病率中归因于某种特定原因的比例,例如由基因变异所致发 病的比例。

23.人群分层(人群结构):在基因相关研究中由病例和对照样本来自于不同祖先人群导致的一种与疾病无关的混杂情况。

  1. 效力:在两组间确实存在差异时,此统计方法能够发现出两组间差异的可能性。

25.单核苷酸多态性:在基因组中最常见的基因变异形式,由于不同的单个替换造成两种 不同的DNA序列。

  1. 标签SNP:一种容易检测的SNP,他与多种其他的SNPs存在强的连锁不平衡,在大规模基
    因分型平台上它可以看做其他这些SNPs的标记。
  2. 三人组: 在基因研究设计中包括一个患者和父母,共三个人。

2. 在全基因关联分析中需要征询的10个问题

1、病例的界定是否明确、可靠,在临床工作中能否正确诊断?
2、在病例和对照的一些可能与遗传和疾病有关的重要特征方面是否具有相互的可比性? 即除了疾病之外的其他因素(如年龄、遗传背景等)的可比性。
3、研究是否具有足够的样本数以检测适度的优势比或相对危险度?
4、基因检测分型平台的密度是否足够获得种群研究中的大部分变异?
5、在基因分型检测中是否充分应用了质量控制手段,包括聚类图目测和另一独立样本的 基因分型平台的重复性?
6、当前的关联结果是否与先前报道的或已知的重复结果相一致?
7、在业已界定的P值显著性意义的基础上,是否在数千次统计分析中应用了严格的校正 手段?
8、初步得出的结果是否已经在其他独立的人群中得到重复验证?
9、在其他得到验证的人群的地理分布和表型等是否具有可比性?如果不具有可比性,那 么,原先结果是否能外推到该人群?
10、得出的基因多态性结果是否有基因功能研究方面的支持证据?


image.png
image.png
上一篇下一篇

猜你喜欢

热点阅读