群体遗传学

4.2 基因型数据描述性统计

2022-08-16  本文已影响0人  Wei_Sun

完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:
plink安装及基础用法 - 简书 (jianshu.com)

统计主要包括标记水平和个体水平两部分:

输入

$ ./plink --allow-extra-chr --freq --hardy --missing --het --vcf genotype.vcf

--allow-extra-chr:允许额外染色体编号
--freq:最小等位基因频率
--hardy:标记杂合度
--missing :标记与个体水平缺失率
--het :个体纯合基因型数目
--vcf :指定 VCF 文件为.vcf,也可以是压缩格式.vcf.gz

输出

plink.frq:标记最小等位基因频率 MAF


plink.hwe:标记杂合度 O(HET)



plink.lmiss: 标记缺失率 F_MISS



plink.imiss:个体缺失率 F_MISS

plink.het:个体纯合度 O(HOM) / N(NM)


引用转载请注明出处,如有错误敬请指出。

上一篇 下一篇

猜你喜欢

热点阅读