GWAS分析-说人话(4)打开文件
前言
这是写给小白的,大神请直接路过(点赞就好了~)
获得文件后怎样打开,偷窥一下内容?
不!要!告!诉!我!双击!文件!!!!!!!
我现在有这样的一个文件:sclschr220191101.fam
想看看中间的sclschr220191101.fam 文件说人话:
打开terminal,cd切换到文件所在目录,然后用vi指令打开,查看,esc后:q退出。
(如果小白确实连这个也不懂,请查看相关linux和Mac上Terminal的操作,我稍后有时间也会写的)
没错,查看文件的代码如下(记得要切换到目录,网上的教程确实很多没有写上这个细节,让小白情何以堪呢!~):
vi sclschr220191101.fam
标题相关的内容已经借宿。华丽的分割线下面,就不用看了。
课题需求,需要把sclschr220191101.fam 文件中的第6行,全部变成2。
(因为下载下来的数据,第六行并不是按我们的需求写上是表型的,为了后面的关联分析,要手工定义第六行是实验组)
什么!不知道为什么是第六行?!请查看之前的GWAS分析-说人话(2)认识文件名,我说过很重要的。
代码如下:
Step 1 mv操作(mac下没有重命名的命令,所以很多时候mv也用来重命名文件)Mac 命令学习 - mv, rm, mkdir
#重命名sclschr220191101.fam文件为tmp文件(这样我们可以在上tmp上面修改)
mv sclschr220191101.fam tmp
Step 2 awk操作(这个awk就复杂一点了,总之awk处理文本文件的语言),人话就是,我们把第六行全部变成2,然后这个东西再成为sclschr220191101.fam文件。
awk '{print $1,$2,$3,$4,$5,$6=2}' tmp > sclschr220191101.fam
这样就达成了修改某一列成为全部一个数的目的了。
人话:相信我,这个骚操作,不单单应用在GWAS分析中,其他大数据的数据整理,都会有用武之地。最好记下来,炫技啊!~
接着对照组也是做用样的骚操作:
mv controlchr220191101.fam tmp
awk '{print $1,$2,$3,$4,$5,$6=1}' tmp > controlchr220191101.fam
vi controlchr220191101.fam
以上!~