
每日paper - 20211207 - smartmrca 推

2021-12-07  本文已影响0人  阿芃

Estimating Time to the Common Ancestor for a Beneficial Allele

2018 年发表在 Mol Biol Evol 上。通讯作者与第一作者为芝加哥大学 Department of Ecology and Evolution 的 Joel Smith。

从变异和重组在单倍型上留下的痕迹,我们可以推断等位基因的年龄(allele age,等位基因出现至今的时间)。研究者们开发了一种新的方法,来探究这种 pattern,并根据现有数据推断一个受到正选择、频率快速升高的等位基因的共同祖先存在的时间。

研究者们使用了隐马尔科夫模型,利用共享祖先单倍型的长度分布、derived 突变在祖先 background 上的积累、以及周围背景单倍型的多样性,来推断 allele age。通过模拟,研究者们演示了结合 both 突变和重组事件的信息能够如何地提高准确性(与只使用一种信息相比)。研究者们还展示了在数据不符合模型假设时,该方法的表现如何,并且提供了一些诊断方法和改善的方法。

使用这种方法,研究者们分析了 1000 Genome Project 中群体特异的 pattern,来推断一些适应性性状的 age。

Visual descriptions of the model.

When a putative variant is identified as the selected site, the nonrandom association of surrounding variants on a chromosome can be used to understand its history.

基于突变和连锁不平衡。最常用的估计 allele age 的方法依靠 summary statistics,可以进一步分为 heuristic 和 model-based methods。Heuristic approximation 依赖于受选择单倍型的平均长度的点估计(受选择位点周围纯合度的衰减),或者是对于受选择位点周围一定区域的衍生突变的数目。

而基于模型的方法一般使用 Approximate Bayesian Computation 框架。寻找与 observed data 符合的特定模型。能够将重组的随机性、突变和谱系历史都结合起来,获得一个 approximate posterior distribution。但是因为仍然是依赖 summary statistics,还是不能够充分利用所有的 relevant features。

现在 full-sequencing 数据越来越容易获得,不需要像以前一样只使用位点间 LD 等维度较低的统计总结来做分析了,可以直接用 full-sequence。所以我们需要更有效的计算方法。

文献解读接下篇:每日paper - 20211229 - smartmrca 推断有利等位基因的 allele age(二)

startmrca 的 github 网址 https://github.com/jhavsmith/startmrca

用于推断 TMRCA。leverages both the recombination rates and the accumulation of new mutations of the targeted allele’s ancestral haplotype. Relative to other approximate Bayesian computation methods, this approach is based on a hidden Markov model and the assumption that the focal allele is subject to positive selection.

上一篇 下一篇

