生物信息比较与进化基因组

连锁不平衡(LD)分析

2021-04-02  本文已影响0人  DumplingLucky

1.连锁不平衡(LD)概念

连锁不平衡(LD)是指不同位点等位基因的非随机关联。LD 的衰减是受重组率和重组代数影响的,研究 LD 的衰减可以揭示群体重组的历史。

假如位于同一染色体的两个等位基因(AB)同时存在的概率大于人群中因随机分布而同时出现的概率,称这两点处于LD状态。

2.LD的度量

一般在LD的度量中最常见的是D'和r2。

当D'=0,r2=0时,处于完全连锁平衡状态

当D'=1,r2=1时,处于完全连锁不平衡状态。

其中,从0-1之间的度量越高,LD越高,如果两个位点连锁,连锁程度也越高。

3.计算LD的软件和使用方法:PopLDdecay

3.1.安装:Linux系统

#下载

git clone https://github.com/BGI-shenzhen/PopLDdecay.git   

# 安装

cd PopLDdecay         

chmod 755 ./configure

./configure

make

cd ./bin/

./PopLDdecay

# 添加到环境变量

echo 'PATH=$PATH:/data1/home/Software/RAxML-8.2.12'  >> ~/.bashrc

source  ~/.bashrc

3.2.计算LD Decay

#单群体:产生“Out.Prefix.png” and “Out.Prefix.pdf”

PopLDdecay -InVCF ALLchr.vcf.gz -OutStat LDDecay.stat.gz 

Plot_OnePop.pl -inFile LDDecay.stat.gz -output Out.Prefix

#多个群体

PopLDdecay -InVCF In.vcf.gz -OutStat wild.stat.gz -SubPop wildName.list 

PopLDdecay -InVCF In.vcf.gz -OutStat cul.stat.gz -SubPop culName.list

Plot_MultiPop.pl -inList multi.list -output OutputPrefix

Note:

文件格式说明

#一个群体多条染色体

PopLDdecay -InVCF Chr1.vcf.gz -OutStat Chr1.stat.gz PopLDdecay -InVCF Chr2.vcf.gz -OutStatChr2.stat.gz PopLDdecay -InVCFChr3.vcf.gz -OutStatChr3.stat.gz ls`pwd`/Chr*.stat.gz > chr.list 

Plot_OnePop.pl -inList chr.list -output OutputPrefix

#多个群体多条染色体

PopLDdecay -InVCF Chr1.vcf.gz -OutStat W.Chr1.stat.gz -SubPop wildName.list 

PopLDdecay -InVCF Chr2.vcf.gz -OutStat W.Chr2.stat.gz -SubPop wildName.list 

PopLDdecay -InVCF Chr1.vcf.gz -OutStat C.Chr1.stat.gz -SubPop culName.list

PopLDdecay -InVCF Chr2.vcf.gz -OutStat C.Chr2.stat.gz -SubPop culName.list 

ls `pwd` /W.Chr*.stat.gz > W.chr.list 

Plot_OnePop.pl -inList W.chr.list -output Wild.cat 

Note:

文件格式说明

软件参数使用:

支持参数

参考:https://github.com/BGI-shenzhen/PopLDdecay/blob/master/Manual.pdf

上一篇下一篇

猜你喜欢

热点阅读