【现学现忘&Shell编程】— 34.AWK编程之awk内置变量

2020-10-22 本文已影响0人繁华似锦Fighting

1、awk内置变量

awk内置变量	作用
`$0`	代表目前awk所读入的整行数据。我们已知awk是一行一行读入数据的，$0就代表当前读入行的整行数据。
`$n`	代表目前读入行的第n个字段。
`NF`	当前行拥有的字段（列）总数。
`NR`	当前awk所处理的行，是总数据的第几行。
`FS`	用户定义分隔符。awk的默认分隔符是任何空格（tab键或者空格），如果想要使用其他分隔符（如“：”），就需要FS变量定义。
`ARGC`	命令行参数个数。
`ARGV`	命令行参数数组。
`FNR`	当前文件中的当前记录数（对输入文件起始为1）。
`OFMT`	数值的输出格式（默认为`%.6`g）。
`OFS`	输出字段的分隔符（默认为空格）。
`ORS`	输出记录分隔符（默认为换行符）。
`RS`	输入记录分隔符（默认为换行符）。

2、练习说明

（1）`$n`练习

使用如下文本

ID      Name    Python  Linux   MySQL   Java
1       Tangs   88      87      86      85.55   
2       Sunwk   99      98      97      96,66   
3       Zhubj   77      76      75      74.44   
4       Shahs   66      65      64      63.33

比如我们提取文本中的第2列数据，执行如下命令：

[root@localhost tmp]# awk '{printf $2 "\n"}' student.txt 
Name
Tangs
Sunwk
Zhubj
Shahs

（2）FS练习

awk的默认分隔符是任何空格（tab键或者空格），如果想要使用其他分隔符，就需要FS变量定义。

cut命令默认是以tab键做为分隔符。

我们之前用cut命令提取过/etc/passwd文件中普通用户的用户名，现在我们来用awk来提取能正常登陆用户的用户名。

执行如下命令：

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk '{FS=":"} {printf $1 "\n"}'
root:x:0:0:root:/root:/bin/bash
user1
user2

说明：FS指定分隔符是一个单独的动作，而打印输出是另外一个动作。

看到上面的结果我们会发现，user1和user2用户的信息正确提取了，而第一行root用户的信息，是把整行的数据都打印输出了，没有按:冒号做为分隔符来正确的提取。

是因为awk先把一行数据读取进awk中，然后在用后面的动作，再对读入的数据进行处理。

也就是说我已经把第一行的root用户的信息，已经读入到awk中，$0、$1、$2等变量已经赋值好了，然后才在后边的动作中看到你指定了:冒号作为分隔符，这个时候第一行数据已经来不及处理了，只能用awk默认的处理方式，用空格作为分隔符来处理，这一行没有空格，就会把这一行的所有数据全部打印出来了。

到了处理第二行数据的时候，awk已经知道要用:冒号作为分隔符，这个时候就可以正确处理数据了。

现在就需要用的BEGIN来处理这个问题，把分隔符的指定{FS=":"}放入BEGIN中就可以了。

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\n"}'
root
user1
user2

这样就可以正确提取到我们需要的数据了。

所以在使用awk的时候，如果需要手动指定分隔符，要把这个指定分隔符的动作写在BEGIN中。

总结：如果有明显的分隔符，推荐优先使用cut命令，因为简单。

但是如果需要一些判断的话，比如我需要根据用户ID，查看某一个用户的用户名。

这个时候用awk就方便很多，cut命令就不能直接处理了，需要写脚本程序进行过滤。

比如打印uid=500的用户的用户名，命令如下：

[root@localhost tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} $3=="500" {printf $1 "\n"}'
user1

# $3=="500"也可以写成$3==500或者$3=/500/都可以

（3）NF和NR练习

我们还是以/etc/passwd文件中的内容为例，需求打印输出可登录的用户的用户名，用户ID，行号，字段数（也就是列数）。

执行如下命令：

# 提示：写法是，输出格式在双引号里，变量在双引号外。
[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" | awk 'BEGIN{FS=":"} {printf $1 "\t" $3 "\t 行号：" NR "\t 字段数：" NF "\n"}'
root    0    行号：1    字段数：7
user1   500  行号：2    字段数：7
user2   501  行号：3    字段数：7

注意一下，最终传入awk中处理的数据就三行，如下：

[root@192 tmp]# cat /etc/passwd | grep "/bin/bash" 
root:x:0:0:root:/root:/bin/bash
user1:x:500:500::/home/user1:/bin/bash
user2:x:501:501::/home/user2:/bin/bash

3、总结：

我们就学会前5个awk内置变量就可以了，后边的awk内置变量一般用不到，换句话说就是能用Shell处理的，就少用awk处理，以后如果真要用到awk进行更深层次的编程，自己再单独的学习一下awk。

【现学现忘&Shell编程】— 34.AWK编程之awk内置变量

1、awk内置变量

2、练习说明

（1）`$n`练习

（2）FS练习

（3）NF和NR练习

3、总结：

猜你喜欢

热点阅读

【现学现忘&Shell编程】— 34.AWK编程之awk内置变量

1、awk内置变量

2、练习说明

（1）$n练习

（2）FS练习

（3）NF和NR练习

3、总结：

猜你喜欢

热点阅读

（1）`$n`练习