【现学现忘&Shell编程】— 26.基础正则表达式练习(一)
(1)准备工作
创建一个测试文档test.txt
Seven times have I despised my soul:
——Kahlil Gibran
The first time when I saw her being meek that she might attain height.
The second time when I saw her limping before the crippled.
The third time when she was given to choose between the hard and the easy, and she chose the easy.
The fourth time when she committed a wrong, and comforted herself that others also commit wrong.
The fifth time when she forbore for weakness, and attributed her patience to strength.
The sixth time when she despised the ugliness of a face, and knew not that it was one of her own masks.
And the seventh time when she sang a song of praise, and deemed it a virtue.
(内容为纪伯伦——我曾七次鄙视自己的灵魂)
还有,为了方便查看,我们可以给grep
命令配置带有颜色输出,也就是给grep
命令定义一个别名。
在当前用户家目录中的~/.bashrc
文件中配置grep
命令别名:
# 我们当前的用户是root用户
# 执行命令
[root@localhost ~]# vim /root/.bashrc
# 添加内容
alias grep='grep --color=auto'
# 或者
# 针对所有用户
# echo "alias grep='grep --color=auto'" >>/etc/bashrc
# 针对单个用户
# echo "alias grep='grep --color=auto'" >>~/.bashrc
这样在grep
命令执行后的标准输出中,就会将文件中匹配的内容标识彩色。
注意:如果在XShell终端修改的~/.bashrc
配置文件,需要关闭当前远程窗口,重新打开就可以实现了。
(2)"*"练习
我们执行如下命令,进行*
匹配练习
[root@localhost tmp]# grep "k*" test.txt
结果如下:
说明:(重点)
任何字母加上*
,或者说任何符号加上*
,都没有任何含义,这样会匹配所有内容,包括空白行。
因为*
的作用是重复前一个字符0次或任意多次。
所以在Shell中的正则中,任何符号加上*
是没有任何含义的,所有的内容都会被匹配出来。
如果你需要匹配至少包含一个k
字母的行,就需要这样写"kk*"
,代表匹配至少包含有一个K
的行,也可以有多个k
。(这行字符串一定要有一个k,但是后面有没有k都可以。)
如下图:
我们可以看到,没有k
的行,和空行都被过滤掉了。
如果我们需要匹配至少两个连续的ss
字符,需要执行如下命令:
grep "sss*" test.txt
以此类推。
注意:
正则是包含匹配,只要含有就会列出,所以单独搜索一个k,执行grep "k" test.txt
命令,也能获得和上面一样的匹配结果。如下图:
换句话说,上面这两种写法是一个意思,都是搜索含有k字母的行,一行中有一个k字母就可以,有无数个k字母也可以,都会被匹配出来。
限位(制)符:
如果是上面描述的这种简单匹配需求,使用哪种方式都可以。
但是有限位(制)符出现的匹配情况,带*的方式,处理匹配的情况更丰富。
如下面一段文本:
Stay hungry, stay foolish. ——Steve Jobs
求知若饥,虚心若愚。——乔布斯
Stay hungry, stay folish. ——Steve Jobs
Stay hungry, stay fooolish. ——Steve Jobs
Stay hungry, stay foooolish. ——Steve Jobs
Stay hungry, stay fooooolish. ——Steve Jobs
我们可以看到上端文本中foolish
中有不同数量的o
。(自己随意错写的)
如果我的需求是搜索foolish
单词中有三个以上数量o
的行,这个时候就需要限位(制)符了,
其中foolish
单词中的f
和l
就是限位(制)符的用法。
执行命令如下:
[root@192 tmp]# grep "foooo*lish" test2.txt
结果如下:
说明:其中前三个o
代表固定有三个连续的o
字母出现,最后一个o*
代表可以匹配0次到任意多次个o字母。
在这种需要有限位(制)符情况下的匹配,加上*
就非常好处理了。