群体遗传学

重测序分析(13)群体进化分析之群体选择分析

2022-10-29  本文已影响0人  Bioinfor生信云

进化论

- 达尔文进化论

- 中性学说

群体选择

有利突变产生 - 受到选择 - 选择性清除

有害突变 - 淘汰 - 多态性降低

正选择的特征及检验方法

群体多态性参数θ

遗传多态性:在一个群体中 ,存在两个或者多个有着相当高频率(通常大于1%)的等位基因时就称为遗传多态性。
Ne为有效群体大小,μ为每个位点的突变速率,群体多态性参数θ定义为:

θ常用的估算:

群体内选择检验Tajima's D

Tajima's D 检验:通过比较θ的两个估计值θw和π的差异来正选择效应

Tajima's D >0 存在大量的中等频率的等位基因 ,可能是由于群体瓶颈效应,群体结构,或者平衡选择引起的
Tajima's D <0 存在大量的低频等位基因位点;可能受到负向选择或者强烈的正向选择作用
Tajima's D =0 符合中性进化假说

基于群体间分歧度检验- FST

FST:固定分化指数,估计亚种群间平均多态性大小与整个种群平均多态性大小的差异,反映了群体结构的变化。

在中性进化条件下, FST的大小主要决定于遗传漂变和迁移等因素的影响,如果种群中一个等位基因因为对于特定生境的适合度较高而经历适应性选择, 那么其频率的升高会增大种群分化水平,有较高的 FST值( 0<= FST<=1, FST为 1 表示亚种群间存在明显的种群分化)

基于群体间分歧度检验-ROD

ROD:基于野生群体和驯化群体间核酸多态性参数π的差异识别选择信号,用来测量驯化群体相对于野生群体的群体多态性损失。


软件和数据准备

软件:vcftools
数据:vcf文件 all.vcf 样品亚群列表文件sample1.txt、sample2.txt

参考脚本

pi值计算

vcftools  --vcf all.vcf  \ # 输入文件
--window-pi 100000  \ # 设置窗口大小
--window-pi-step  10000  \ #每次滑动的距离
--keep  sample1.txt    \ #亚群列表
--out ./Pi.sample1 #输出文件
Pi.sample1

Tajima's D计算

vcftools --vcf all.vcf  \
--TajimaD  100000 \
--keep  sample1.txt   \
--out TajimaD.sample1
TajimaD.sample1

FST计算

vcftools  --vcf  all.vcf \#输入文件
--fst-window-size 100000  \ #设置窗口大小
--fst-window-step 10000  \ #每次滑动的距离
--weir-fst-pop  sample1.txt \ #第一个亚群列表
--weir-fst-pop sample2.txt \ #第二个亚群列表
--out  ./Fst.sample1.sample2  #输出文件
Fst.sample1.sample2

欢迎关注Bioinfor 生信云

上一篇 下一篇

猜你喜欢

热点阅读