生物信息学gwas

GWAS - plink介绍与安装(Mac)

2020-05-26  本文已影响0人  SnowPye

此教程写给像博主一样的小白,欢迎各路大神批评指正

GWAS

GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位。
简单来讲,就是找出基因中哪些序列变异(SNP)与疾病相关。即就是统计一个数,找出与表型最有显著性意义的那些基因(位点)。分析方法有:逻辑回归(表型数据为二元);线性回归(表型数据为连续性变量);表型数据正态分析(如果不是正态分布,需转换处理为正态分布)。

R包、plink和EMMAX都可以做GWAS,但是据说后两者做GWAS更快,更容易写出pipeline。以及实验室师兄师姐均采用plink,因此选择学习这个工具。

plink介绍

PLINK是一个免费的开源全基因组关联分析工具集,在SNP数据统计,过滤,GWAS分析中都可以用得上,而且计算速度很快。直接去百度上搜索plink就可以很容易就找到plink官网(http://www.cog-genomics.org/plink2)功能大概有以下几种:

plink下载

官网现在更新呦plink1.9与plink2.0版本,可以根据自己需要下载,我选择的是1.9 stable版本。
plik下载方便,只要找到相应的系统的版本就可以进行下载了,下载链接地址为:http://www.cog-genomics.org/plink2/下载完解压即可立即使用。


此时在终端中直接输入plink不可行哦
电脑会告诉你没有plink这个命令-bash: plink: command not found


./plink --help
./plink --vcf Arab.vcf --allow-extra-chr --maf 0.05 --recode --out Arab
vim .bash_profile
#然后按i键进入编辑模式,输入以下语句,其中路径为解压plink的文件夹路径
export PATH=/Users/Downloads/plink_mac_20200428:$PATH
#输完后回车,按ESC
 :w  #表示保存
 :q #表示退出
source .bash_profile  #更新即可

之后即可在终端中直接调用plink命令啦!!冲鸭!

上一篇 下一篇

猜你喜欢

热点阅读