GWAS的sense

plink - 关于提取某一个特定的SNP

2020-06-22  本文已影响0人  SnowPye

一、 查看某一个snp的基因型频率

plink --bfile file --snp rs10402893 --freq --out rs10402893 --noweb

如果要计算全部snp频率则去掉“--snp rs10402893”命令就好

二、 计算某一个snp是否符合哈迪温伯格检验检验:

跟上面计算基因型频率类似,不过是将 --freq 改成 --hardy

plink --bfile file --snp rs10402893 --hardy --out rs10402893_hw --noweb

同样,如果要计算全部snp则去掉“--snp rs10402893”命令就好
结果如图所示:



第一列 snp 所在染色体
第二列 snp 名称
第三列 test的名称
第四列 Minor allele code 次要等位基因频率
第五列 Major allele code 主要等位基因频率
第六列 具体数据 也就是 AA Aa aa 的个数
第七列 观察到的2pq 的值
第八列 期望的2pq的值
第九列 对这个数据进行卡方检验,看显不显著

三、 提取某一个特定的SNP的信息

plink --bfile file --extract rs10402893.txt --make-bed --out rs10402893

会得到关于这一个snp的.bed .fam 和 .bim文件
如果想提取很多snp,则把rs号写进“--extract rs10402893.txt”的txt中,格式为一列rs号(即每一个rs号占一行)

plink --file ped --extract rs10402893.txt --recode --out rs10402893

注意:-file可以自动读取ped文件,因此像-bfile命令一样,不需要文件后缀,不然就报错了哦亲:>

四、使用plink实现bed、bim与ped、map之间的转换

 plink --bfile file --recode --out file --noweb
plink --file test --make-bed --out test3

@小插曲 我竟然在macbook上搞了好久怎么写txt文件,而不是什么多信息文本??
打开文本编辑器 - 文件 - 新建 完了之后点击菜单栏上的 格式 - 制作纯文本 就可以了!>

上一篇下一篇

猜你喜欢

热点阅读