每日paper - 20211208 - 印度虎群体结构 AIM
Recapitulating whole genome based population genetic structure for Indian wild tigers through an ancestry informative marker panel
通讯作者为分别来自 National Centre for Biological Sciences 和 Yenepoya Research Centre 的 Anubhab Khan 和 Ranajit Das。
用全基因组数据分析了印度虎的群体遗传结构,然后开发了一套 AIM,能够以最小数目的 SNP 重现用全基因组数据得出的结构。
为检验 AIM 的 robustness,研究者们将其应用于来自整个印度的其他虎的另一个独立的数据集,该数据集包含 AIM 中 92 个 SNP 里的 49 个,并且足以重现由全基因组数据构建的种群遗传结构。大猫中的第一套基于 SNP 的 AIM。
Fig 1. Sample locations of tiger from across India将数据集分为 17 只和 18 只个体,用于 developing 和 testing AIMs panel。
用了四种方法来检测 ancestry-specific SNP markers:
1. Infocal:选出了最 informative 的 10000 个 SNP;
2. ADMIXTURE:从 P 文件选出祖先群体的 SNP 等位基因频率,也是选出最高的 10000 个 SNP;
3. FST:对每个 SNP 计算 FST,选出 FST 值最高的 10000 个;
4. SmartPCA:选出 weightage 最高的 10000 个 SNP。
将这些 10000 个的 SNP 的量和质量与完整的 SNP set(CSS)作比较。对于量的比较,用 ADMIXTURE 和 PCA 进行,对选出的 SNP 和 CSS 分别计算四个祖先成分的 Euclidean distance(ED),和 CSS 差得最小的 subset 被认为是最佳的选择 AIM 的策略(上面提到的四种选择 AIM 的策略)。
选择了 4 种策略的consensus SNP set,绘制了韦恩图来进行选择,基于最优方法选择了共有 loci(不是直接选共有就行了吗?还会变?)。