GWAS分析-说人话(11)使用fcGENE软件转化成plink
前言:
如何使用软件?这还不简单?!
不要告诉我双击打开就好了!
不过这一篇的内容都消化的话,
是可以“读懂”一类型的生信文章的~
什么是fcGENE?
fcgene软件是一个支持SNP数据管理,质量控制和分析工作流程。
fcGENE的主要命令选项如下:
fcGENE的主要命令选项想了解更多,可以阅读原文fcGENE: A Versatile Tool for Processing and Transforming SNP Datasets。
安装过程看前一话~安装fcGENE软件
说人话!
这就是一个GWAS分析中可能使用到的工具,但是更多的功能,
请自己了解!!
阅读说明书和算法文章是王道!!!是生物信息学的修行!~~
但是,根据说人话的风格~
我还是会给小白说举个栗子🌰的!~
例如,如何使用BEAGLE工具转化成plink格式?
首先,我们看到文章的Table 1. Major command options of fcGENE.
教你如何看文章哦~使用BEAGLE工具转化成plink格式需要用到的指令是:
--bgl-gprobs (使用BEAGLE工具) 和 --oformat (转换格式)。
人话:是的,对于小白,我就算给你翻译成中文也看不懂的~
直接上操作~
首先打开Terminal (不要告诉我不知道这是什么.......)
接着cd到数据所在的目录(不要告诉我不知道这是什么.......)
然后,根据fcgene软件所在目录调动软件
我把软件装在这里了(直接拖就好)然后就是运行常规的指令:
打上“--bgl-gprobs 文件名(拉入需要处理的软件“本例子为:plco_c1.chr1.gprobs.gz”)”
调动转换程序 --oformat plink(因为我们要转换成plink格式)
打上--out 给个名字呗~(一号染色体的数据,我叫chr1,自己随便改)
所以全代码如下:
自己的工作目录$ ~Downloads/fcgene-1.0.7/fcgene --bgl-gprobs plco_c1.chr1.gprobs.gz -- oformat plink --out chr1
没错,目录(一开始cd的那个地方)就会产生一个想要的文件了~~
不需要“高端操作的”,直接忽略分割线下面的内容~
什么是高端操作?
有没有留意上面的只是处理了一个染色体的数据?
然卵,人是有23对染色体的~~
聪明的人类,总不会1个1个做吧?
这是时候就使用写轮眼了!~
没错!是 写轮眼!(大家支持的话,是有专题的哦!~)
生物信息学中的写轮眼-“发动循环”就是利用for循环,执行相同的操作啦!~(黑体部分)
例如,对第8到第11个执行这个操作。
for i in {8..11};do XXX; done
自己的工作目录$ for i in {8..11};do ~Downloads/fcgene-1.0.7/fcgene --bgl-gprobs plco_c1.chr$i.gprobs.gz -- oformat plink --out chr$i; done
注意:有数字的地方都要改成i
有人问,为什么要分开?不直接1到23?
首先这涉及两个问题:
1.你的数据争不争气 —— 有些下载的数据,不放在一起,有些缺失,有些命名不一致!;
2.你的电脑争不争气 —— 你的电脑跑不跑得动啊!~超级计算机的话(什么云什么一号的可能可以)。