基因组变异分析

plink转化文件格式

2019-03-26  本文已影响0人  KK_f2d5

想使用一组已经是bed bim fam,在R语言中进行操作。
bed文件是一个二进制文件,看不到
bim文件总共有六行,包含了snp(variants)的具体信息,也就是geno信息

1.第一列是染色体信息
2.第二列是snp的名字
3.第三列是摩尔距离,文件中说可以用0,没关系
4.第四列是物理距离
5.第五列是次要等位基因
6.第六列是主要等位基因

fam文件记录个体信息,类似pheno信息

#转化为ped,map文件
plink --bfile 1-Stoort --recode --out 1-Stoort
#转化为0,1,2文件,信息在.raw文件中
plink --bfile 1-Stoort --recodeA --out 1-Stoort

我们通过R语言提取fam文件的一定列数。再用plink将bed,bim等文件补齐,也就是对应抽取fam文件的相对应文件。

plink --bfile 1-Stoort --keep new.txt --make-bed --out new
plink --bfile 1-Stt --keep new.txt --chr 1 --make-bed --out new_200_chr1#如果只想要第六个染色体的信息
#去掉连锁不平衡的snp位点
plink --bfile new --indep-pairwise 100 10  0.1
#保存下来筛选过后的信息
plink --bfile new_200_chr1 --extract plink.prune.in --make-bed --out prunedata

recode生成的raw文件有:FID IID PAT MAT SEX PHENOTYPE snp1 snp2 .....的信息

上一篇下一篇

猜你喜欢

热点阅读