生物信息学

GWAS - plink提取染色体位置范围内的SNP位点

2020-05-30  本文已影响0人  SnowPye

一、首先学会打开文件

写给像我一样的小白,如果你手头有bim、fam等文件,怎么查看呢?
双击是不行的!!!!首先打开terminal,cd到文件所在的目录,然后使用vim命令:

cd /User/Downloads/sge_genedata 
vi xxxxx.bim 

其中,文件位路径只需要直接选中文件夹,并且拖到terminal中就可以了!!

二、plink命令与文件格式:–bfile 、 --file 和 --tfile

使用–bfile 、 --file 和 --tfile读取文件类型不一样:
–bfile 读取二进制文件,bed、bim和fam格式
–file 读取文本文件,ped和map格式
使用以上两个命令时,文件命名要一致,如test.bed、test.bim、test.fam
二进制文件比较小,处理速度比较快

三、下载一定染色体位置范围内的所有SNP


根据注释可以知道,这条命令包括两个文件夹

plink--bfile /Users/Downloads/sge_genedata/sge_qc_clean 
--extract range /Users/Downloads/sge_genedata/myrange.txt 
--make-bed --out rangsnp

*如果没有把plink设入全局变量,则需要在plink前面加入plink的路径

使用一中介绍的vi命令 ,便可以查看提取的snp信息啦!!!
其中.log文件也可以双击打开,可以看到结果显示4416744 variants loaded from .bim file,即源文件中有这么多位点。--extract range: 24339 variants remaining.使用这行命令提取出的snp有24339个。

上一篇下一篇

猜你喜欢

热点阅读