shellLinux

【现学现忘&Shell编程】— 34.AWK编程之awk内置变量

2020-10-22  本文已影响0人  繁华似锦Fighting

1、awk内置变量

awk内置变量 作用
$0 代表目前awk所读入的整行数据。我们已知awk是一行一行读入数据的,$0就代表当前读入行的整行数据。
$n 代表目前读入行的第n个字段。
NF 当前行拥有的字段(列)总数。
NR 当前awk所处理的行,是总数据的第几行。
FS 用户定义分隔符。awk的默认分隔符是任何空格(tab键或者空格),如果想要使用其他分隔符(如“:”),就需要FS变量定义。
ARGC 命令行参数个数。
ARGV 命令行参数数组。
FNR 当前文件中的当前记录数(对输入文件起始为1)。
OFMT 数值的输出格式(默认为%.6g)。
OFS 输出字段的分隔符(默认为空格)。
ORS 输出记录分隔符(默认为换行符)。
RS 输入记录分隔符(默认为换行符)。

2、练习说明

(1)$n练习

使用如下文本

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55   
2       Sunwk   99      98      97      96,66   
3       Zhubj   77      76      75      74.44   
4       Shahs   66      65      64      63.33 

比如我们提取文本中的第2列数据,执行如下命令:

[root@localhost tmp]# awk '{printf $2 "\n"}' student.txt 
Name
Tangs
Sunwk
Zhubj
Shahs

(2)FS练习

awk的默认分隔符是任何空格(tab键或者空格),如果想要使用其他分隔符,就需要FS变量定义。

cut命令默认是以tab键做为分隔符。

我们之前用cut命令提取过/etc/passwd文件中普通用户的用户名,现在我们来用awk来提取能正常登陆用户的用户名。

执行如下命令:

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk '{FS=":"} {printf $1 "\n"}'
root:x:0:0:root:/root:/bin/bash
user1
user2

说明:FS指定分隔符是一个单独的动作,而打印输出是另外一个动作。

看到上面的结果我们会发现,user1user2用户的信息正确提取了,而第一行root用户的信息,是把整行的数据都打印输出了,没有按:冒号做为分隔符来正确的提取。

是因为awk先把一行数据读取进awk中,然后在用后面的动作,再对读入的数据进行处理。

也就是说我已经把第一行的root用户的信息,已经读入到awk中,$0$1$2等变量已经赋值好了,然后才在后边的动作中看到你指定了:冒号作为分隔符,这个时候第一行数据已经来不及处理了,只能用awk默认的处理方式,用空格作为分隔符来处理,这一行没有空格,就会把这一行的所有数据全部打印出来了。

到了处理第二行数据的时候,awk已经知道要用:冒号作为分隔符,这个时候就可以正确处理数据了。

现在就需要用的BEGIN来处理这个问题,把分隔符的指定{FS=":"}放入BEGIN中就可以了。

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\n"}'
root
user1
user2

这样就可以正确提取到我们需要的数据了。

所以在使用awk的时候,如果需要手动指定分隔符,要把这个指定分隔符的动作写在BEGIN中。

总结:如果有明显的分隔符,推荐优先使用cut命令,因为简单。

但是如果需要一些判断的话,比如我需要根据用户ID,查看某一个用户的用户名。

这个时候用awk就方便很多,cut命令就不能直接处理了,需要写脚本程序进行过滤。

比如打印uid=500的用户的用户名,命令如下:

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} $3=="500" {printf $1 "\n"}'
user1

# $3=="500"也可以写成$3==500或者$3=/500/都可以

(3)NF和NR练习

我们还是以/etc/passwd文件中的内容为例,需求打印输出可登录的用户的用户名,用户ID,行号,字段数(也就是列数)。

执行如下命令:

# 提示:写法是,输出格式在双引号里,变量在双引号外。
[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\t 行号:" NR "\t 字段数:" NF "\n"}'
root    0    行号:1    字段数:7
user1   500  行号:2    字段数:7
user2   501  行号:3    字段数:7

注意一下,最终传入awk中处理的数据就三行,如下:

[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" 
root:x:0:0:root:/root:/bin/bash
user1:x:500:500::/home/user1:/bin/bash
user2:x:501:501::/home/user2:/bin/bash

3、总结:

我们就学会前5个awk内置变量就可以了,后边的awk内置变量一般用不到,换句话说就是能用Shell处理的,就少用awk处理,以后如果真要用到awk进行更深层次的编程,自己再单独的学习一下awk。

上一篇下一篇

猜你喜欢

热点阅读