Wego input文件准备
2021-12-10 本文已影响0人
bio_橡树
今天通过几行代码来准备Wego input的文件:
-
Wego官网要求的输入文件格式(https://wego.genomics.cn/)
1639148090(1).jpg
-
现有GO分析结果
1639148267(1).jpg -
要把gene编号和对应的GO编号提取出来,用sed和awk命令实现。
第一步:先把##和%都替换成 \t
sed -e 's/%/\t/g' -e 's/##/\t/g' data.txt
第二步:用awk把带有GO的列输出
awk '{print $1}{ for(i=1;i<=NF;i++)if($i~/GO/) print $(i)}' go.txt >1.txt
第三步:再把\nGO替换成GO
在vim编辑器里%s/\nGO/GO/g(因为sed里不识别\n)