连锁不平衡(LD)分析
1.连锁不平衡(LD)概念
连锁不平衡(LD)是指不同位点等位基因的非随机关联。LD 的衰减是受重组率和重组代数影响的,研究 LD 的衰减可以揭示群体重组的历史。
假如位于同一染色体的两个等位基因(AB)同时存在的概率大于人群中因随机分布而同时出现的概率,称这两点处于LD状态。
2.LD的度量
一般在LD的度量中最常见的是D'和r2。
当D'=0,r2=0时,处于完全连锁平衡状态
当D'=1,r2=1时,处于完全连锁不平衡状态。
其中,从0-1之间的度量越高,LD越高,如果两个位点连锁,连锁程度也越高。
3.计算LD的软件和使用方法:PopLDdecay
3.1.安装:Linux系统
#下载
git clone https://github.com/BGI-shenzhen/PopLDdecay.git
# 安装
cd PopLDdecay
chmod 755 ./configure
./configure
make
cd ./bin/
./PopLDdecay
# 添加到环境变量
echo 'PATH=$PATH:/data1/home/Software/RAxML-8.2.12' >> ~/.bashrc
source ~/.bashrc
3.2.计算LD Decay
#单群体:产生“Out.Prefix.png” and “Out.Prefix.pdf”
PopLDdecay -InVCF ALLchr.vcf.gz -OutStat LDDecay.stat.gz
Plot_OnePop.pl -inFile LDDecay.stat.gz -output Out.Prefix
#多个群体
PopLDdecay -InVCF In.vcf.gz -OutStat wild.stat.gz -SubPop wildName.list
PopLDdecay -InVCF In.vcf.gz -OutStat cul.stat.gz -SubPop culName.list
Plot_MultiPop.pl -inList multi.list -output OutputPrefix
Note:
文件格式说明#一个群体多条染色体
PopLDdecay -InVCF Chr1.vcf.gz -OutStat Chr1.stat.gz PopLDdecay -InVCF Chr2.vcf.gz -OutStatChr2.stat.gz PopLDdecay -InVCFChr3.vcf.gz -OutStatChr3.stat.gz ls`pwd`/Chr*.stat.gz > chr.list
Plot_OnePop.pl -inList chr.list -output OutputPrefix
#多个群体多条染色体
PopLDdecay -InVCF Chr1.vcf.gz -OutStat W.Chr1.stat.gz -SubPop wildName.list
PopLDdecay -InVCF Chr2.vcf.gz -OutStat W.Chr2.stat.gz -SubPop wildName.list
PopLDdecay -InVCF Chr1.vcf.gz -OutStat C.Chr1.stat.gz -SubPop culName.list
PopLDdecay -InVCF Chr2.vcf.gz -OutStat C.Chr2.stat.gz -SubPop culName.list
ls `pwd` /W.Chr*.stat.gz > W.chr.list
Plot_OnePop.pl -inList W.chr.list -output Wild.cat
Note:
文件格式说明软件参数使用:
支持参数参考:https://github.com/BGI-shenzhen/PopLDdecay/blob/master/Manual.pdf