GWAS专题重测序下游分析软件使用

LD连锁不平衡--PopLDdecay

2021-04-19  本文已影响0人  杨博士聊生信

在群体遗传学分析中,我们经常会碰到关于连锁不平衡的问题,当然计算连锁不平衡的软件有很多,包括plink2、haploview等,今天在这里给大家分享一个计算连锁不平衡的软件-PopLDdecay,以及如何使用该软件绘制LD decay图。PopLDdecay于2018 年 10 月发表于Bioinformatics 杂志上。

先简单介绍一下什么叫连锁不平衡以及计算连锁不平衡有什么作用吧。
LD:当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时,就称这两个座位处于连锁不平衡状态(linkage disequilibrium)。
LD衰减(LD Decay): 指位点间由连锁不平衡到连锁平衡的演变过程;LD衰减的速度在不同物种间或同物种的不同亚群间,往往差异非常大。所以,通常会使用1个标准——“LD衰减距离”来描述LD衰减速度的快慢。

LD Decay的应用:
1. 判断GWAS所需标记量,决定GWAS的检测效力以及精度,
GWAS标记量 = 基因组大小/LD衰减距离。
2.辅助分析进化与选择, 一般来说,野生群体比驯化改良群体LD衰减快,异花授粉植物比自花授粉植物LD衰减快。

了解完基本信息后,我们开始学习使用PopLDdecay做图和分析

Step1:下载安装PopLDdecay

git clone https://github.com/BGI-shenzhen/PopLDdecay.git
chmod 755 configure;
./configure;
make;
mv PopLDdecay  ./bin/;

这里还有几种其它方法下载和安装,这里就不再赘述,安装碰到问题,可以私信我。
安装好后,执行./bin/PopLDdecay,出现以下界面,即安装成功。


image.jpeg

Note:
1)用户可以使用“-MaxDist”命令定义最大距离,默认值为300 kb
2)用户可以使用参数“-MAF”、“-Het”和“-Miss”定义自己的筛选条件
3要计算VCF文件中的subgroup LD衰减,将它们的名称放入列表文件,并使用“–SubPop A.List”参数

Step2:计算LD decay

#2.1 For gatk VCF file deal, run PopLDdecay direct
./bin/PopLDdecay  -InVCF  SNP.vcf.gz  -OutStat LDdecay   
#2.2 For plink [.ped .map], chang plink 2 genotype first  2) run PopLDdecay  
perl bin/mis/plink2genotype.pl -inPED in.ped -inMAP in.map -outGenotype out.genotype ;   
./bin/PopLDdecay -InGenotype out.genotype -OutStat LDdecay 
#2.3 To Calculate the subgroup GroupA LDdecay in VCF Files   # put GroupA sample name into GroupA_sample.list
./bin/PopLDdecay -InVCF -OutStat -SubPop GroupA_sample.list

Step3: 对LD decay做图

#3.1 For one Population
perl bin/Plot_OnePop.pl -inFile LDdecay.stat.gz -output Fig
#3.2 For one Population muti chr  # List Format [chrResultPathWay]
perl bin/Plot_OnePop.pl -inList Chr.ReslutPath.List -output Fig
#3.3 For muti Population #List Format:[Pop.ResultPath  PopID ]
perl bin/Plot_MutiPop.pl -inList Pop.ReslutPath.list -output Fig

使用命令perl Plot_OnePop.pl可以查看画LD decay图的参数。


image.jpeg

我们可以在LDdecay.stat.gz文件中看LD decay的结果, 在Fig.png或Fig.pdf看LD 衰减图。


LD decay.png

图片来源于文献(Tong wei, 2021)

这三幅图是Tong Wei等研究者利用该软件做的图,于2021年4月发表在Nature Genetics杂志上。

参考:

  1. 群体遗传分析—LD连锁不平衡- 搜狐网

https://m.sohu.com/a/234594093_761120?trans=010004_pcwzy

2.Chi Zhang, Shan-Shan Dong, Jun-Yang Xu, Wei-Ming He, Tie-Lin Yang, PopLDdecay: a fast and effective tool for linkage disequilibrium decay analysis based on variant call format files, Bioinformatics, Volume 35, Issue 10, 15 May 2019, Pages 1786–1788, https://doi.org/10.1093/bioinformatics/bty875

  1. Wei T, et al. Whole-genome resequencing of 445 Lactuca accessions reveals the domestication history of cultivated lettuce. Nat. Genet., (2021).
上一篇下一篇

猜你喜欢

热点阅读