多表型大文件GWAS结果使用R语言提取汇总

2020-04-23  本文已影响0人  良田农庄

本脚本适用于GAPIT产生的GWAS结果:

library(dplyr)   #子集的包
tmp<-data.frame()   #创建空的数据集
myfiles <- Sys.glob("GAPIT*.Results.csv")  #搜索文件夹内所有的gwas结果文件
print(paste(myfiles,"has been found"))    #显示所有找到的结果文件
for(i in myfiles)   #循环开始
{new_trait<-read.csv(file=i,header = TRUE,sep = ",")   #读取文件
newdata <- subset(new_trait, P.value < 1e-6)    #筛选pvalue列中小于1e-6的行,提取至新的文档newdata
newdata$trait<-i              #创建新的列,标注该表型名称
tmp<-rbind(tmp,newdata)   #与之前的文件合并
}

汇总文件在tmp中,输出为csv即可。
提取的仅仅是显著位点(阈值自己调整)

上一篇下一篇

猜你喜欢

热点阅读