awk 按照列名和顺序提取指定列数据
2022-03-24 本文已影响0人
吃吃吃_就知道吃
说明
需要两个文件,f1为需要提取的列名,自上而下为提取顺序;f2为待提取的矩阵,第一列默认输出。
f1示例

f2示例

脚本
awk 'BEGIN{FS=OFS="\t"}NR==FNR{a[NR]=$1}NR>FNR&&FNR==1{for(i=1;i<length(a)+1;i++){for(j=1;j<NF+1;j++){if(a[i]==$j){b[j]=$j}}}}NR>FNR{printf $1;for(i=1;i<length(a)+1;i++){for(j=1;j<NF+1;j++){if(a[i]==b[j]){printf "\t"$j}}}print ""}' pheno.file matrix.02
即
awk '
BEGIN{
FS=OFS="\t"
}NR==FNR{
a[NR]=$1
}NR>FNR&&FNR==1{
for(i=1;i<length(a)+1;i++){
for(j=1;j<NF+1;j++){
if(a[i]==$j){
b[j]=$j
}
}
}
}NR>FNR{
printf $1
for(i=1;i<length(a)+1;i++){
for(j=1;j<NF+1;j++){
if(a[i]==b[j]){
printf "\t"$j
}
}
}
print ""
}' pheno.file matrix.02
结果
