每日paper - 20211208 - 印度虎群体结构 AIM

2021-12-08 本文已影响0人阿芃

Recapitulating whole genome based population genetic structure for Indian wild tigers through an ancestry informative marker panel

通讯作者为分别来自 National Centre for Biological Sciences 和 Yenepoya Research Centre 的 Anubhab Khan 和 Ranajit Das。

用全基因组数据分析了印度虎的群体遗传结构，然后开发了一套 AIM，能够以最小数目的 SNP 重现用全基因组数据得出的结构。

为检验 AIM 的 robustness，研究者们将其应用于来自整个印度的其他虎的另一个独立的数据集，该数据集包含 AIM 中 92 个 SNP 里的 49 个，并且足以重现由全基因组数据构建的种群遗传结构。大猫中的第一套基于 SNP 的 AIM。

Fig 1. Sample locations of tiger from across India

将数据集分为 17 只和 18 只个体，用于 developing 和 testing AIMs panel。

用了四种方法来检测 ancestry-specific SNP markers：

1. Infocal：选出了最 informative 的 10000 个 SNP；

2. ADMIXTURE：从 P 文件选出祖先群体的 SNP 等位基因频率，也是选出最高的 10000 个 SNP；

3. FST：对每个 SNP 计算 FST，选出 FST 值最高的 10000 个；

4. SmartPCA：选出 weightage 最高的 10000 个 SNP。

将这些 10000 个的 SNP 的量和质量与完整的 SNP set（CSS）作比较。对于量的比较，用 ADMIXTURE 和 PCA 进行，对选出的 SNP 和 CSS 分别计算四个祖先成分的 Euclidean distance（ED），和 CSS 差得最小的 subset 被认为是最佳的选择 AIM 的策略（上面提到的四种选择 AIM 的策略）。

选择了 4 种策略的consensus SNP set，绘制了韦恩图来进行选择，基于最优方法选择了共有 loci（不是直接选共有就行了吗？还会变？）。

每日paper - 20211208 - 印度虎群体结构 AIM

Recapitulating whole genome based population genetic structure for Indian wild tigers through an ancestry informative marker panel

猜你喜欢

热点阅读