群体遗传学

重测序分析(12)群体进化分析之LD衰减分析

2022-10-27  本文已影响0人  Bioinfor生信云

LD概念

LD衰减分析位点之间由连锁不平衡到连锁平衡的演变过程,可以查看整个群体及亚群的连锁水平。

LD r2计算公式

r2 是一个0-1之间的数值,0表示两个座位完全不相关,1表示完全相关

LD衰减

应用

软件和数据准备

参考脚本

1.两个亚群r^2值汇总统计

/home/PopLDdecay/bin/PopLDdecay  \ #软件的安装位置
-InVCF  ./all.vcf  \ # 输入vcf文件
-SubPop  ./sample1.txt  \ # 指定要分析的亚群文件
-MaxDist 500  \ # 最大SNP对距离,超过此范围不进行计算
-OutStat sample1.stat # 输出文件
# 同样运行第二个亚群,只需替换亚群文件即可

r2和D'反映了LD的不同方面。r2包括了重组和突变,而D'只包括重组史。D'能更准确地估测重组差异,但样本较小时,低频率等位基因组合可能无法观测到,导致LD强度被高估,所以D'不适合小样本群体研究;

LD衰减作图中通常采用r2来表示群体的LD水平;Haplotype Block中通常采用D'来定义Block;迁移、突变、选择、有限的群体大小以及其他引起等位基因频率改变的因素,这些都会引起LD的改变。

perl /home/PopLDdecay/bin/Plot_OnePop.pl \ 
-inFile sample1.stat.gz \ # 输入文件
-output sample1.ld  #输出文件

3.多个亚群共同绘图

准备文件:sample.list (亚群信息表,第一列输出文件id 第二列分布地区)
sample1.stat.gz SC
sample2.stat.gz YZR

perl /home/PopLDdecay/bin/Plot_MultiPop.pl \
-inList  sample.list \
-output sample.list

欢迎关注Bioinfor 生信云公众号!

上一篇 下一篇

猜你喜欢

热点阅读