从零开始学习Linux(四十三):Shell编程之awk命令
1、awk命令简介
awk命令是一种处理文本文件的语言,是一个强大的文本分析工具。
awk命令也可以叫awk编程,能够识别非制表符的空格,可以解决cut命令解决不了的问题。
awk命令非常复杂,本章节我们只介绍部分常用的功能。
2、awk命令格式
命令格式:awk '条件1{动作1} 条件2{动作2}…' 文件名
条件:
一般使用关系表达式作为条件
x > 10 判断变量x是否大于10;
x >= 10 判断变量x是否大于等于10;
x <= 10 判断变量x是否小于等于10;
动作:
格式化输出;
流程控制语句;
3、awk命令使用说明
创建成绩单文件score.txt,内容如下:

3.1、提取成绩单中第2列和第4列
执行命令:
awk '{printf $2 "\t" $4 "\n"}' score.txt
命令中$2代表第2列,$4代表第4列。命令中没有加入任何条件,所以针对的是文件中的每一行数据。对每一行数据打印第2列和第4列。命令执行结果如下图所示:

3.2、提取按空格分隔的内容
使用 df -h 命令,查看空间占用情况。命令输出内容如下图所示:

df命令输出结果是以空格分隔的,而非Tab键。
执行命令,提取输出结果的中FileSystem列和Mounted列:
df -h | awk '{printf $1 "\t" $6 "\n"}'
命令执行结果如下所示:

执行以下命令也可以输出同样的结果:
df -h | awk '{print $1 "\t" $6}'

两条命令区别:
- printf 不可以自动换行,需要在行尾增加换行符;
- print 可以在末尾自动换行;
- 在Linux系统中没有print命令只有printf命令,在awk命令中两个都支持;
3.3、BEGIN
注意:BEGIN必须是大写,它是一个条件。它的作用是强制第一个执行他后面的语句。
执行命令:
awk 'BEGIN{printf "Test Begin \n"}{printf $2 "\t" $4 "\n"}' score.txt
执行结果如下图所示:

BEGIN{printf "Test Begin \n"} 会在输出文件内容第2列和第4列之前输出一句话Test Begin。
3.4、END
同BEGIN相类似,END是强制最后一个执行它后面的语句。
同时指定BEGIN和END,执行命令:
awk 'BEGIN{printf "Test Begin \n"}{printf $2 "\t" $4 "\n"}END{printf "Test End \n"}' score.txt
输出结果如下图所示:

3.5、FS内置变量
可以在BEGIN中通过FS内置变量指定分隔符。
FS=':',表示指定:为分隔符。
cat /etc/passwd | grep "/bin/bash"
查看passwd文件中可登陆用户信息,输出结果如下图所示:

指定分隔符按照:分隔,将结果输出第一列和第三列,执行命令:
cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\n"}'
命令执行结果如下图所示:

3.6、关系运算符
筛选出来语文成绩大于等于90的同学,输出其名称和语文成绩。执行命令:
cat score.txt | awk '$3>=90{printf $2 "\t" $3 "\n"}'
命令执行结果,如下图所示:

说明:awk命令还有其他的功能,其功能非常强大。专门有书籍介绍awk命令,有兴趣的可以自行摸索使用方法。