sed的分组用法
在sed 启用扩展正则表达式之后,通常更多的配合分组功能进行使用,这时候需要注意的内容如下:
A. 启用sed 的扩展正则表达式的方法是使用 -r 参数
B. 启用扩展正则表达式之后,小括号是可以自动识别为“分组的分割符号”,也就是说小括号不是普通的字符;
C. \s 表示空格或者tab 键, 而 * 表示任意个数的字符,? 表示0 或者一个字符,+ 表示一个或者多个字符,而 . 表示任意字符
D. 启用分组以后,在对分组进行引用的时候,用 \1, \2 之类的表示方式,其中 \1就是小括号引用起来的第一个分组,依次类推,可以使用很多个分组
E. 在使用分组的时候,最常见的一种情形是:确认每个分组匹配的长度,这个遵循的一个重要原则是: .* 组合的长度取决于前面的组合以及后面的组合, .* 本身无法确定所匹配的字符串; 那么,如果要把 .* 作为分组的最后一部分怎么办呢,那这时候,其右边的边界就是 结束符号 $.
F. 在sed 启用扩展正则表达式后,中括号 和大括号并不是作为普通字符看待,所以如果要把中括号, 大括号识别为普通字符,那么需要加上反斜杠;
这里需要注意的是:大括号"在grep -E"的使用中,是作为普通字符进行处理的,如果我们用man grep 来查看其帮忙文档,可以找到对应的描述;这和在sed 的扩展正则表达式中是不一致的,如果在sed 帮助文档中没有指明某个特殊符号的特别说明,那么都是和 扩展正则表达式是一致的;
G:
如果使用sed的替换功能来修改文件的某一行,那么要对一整行进行匹配,尽量不做只匹配部分内容的操作,否则可能会导致出现问题,而要对一整行做一个完整匹配,就离不开使用分组功能,特别是 .* 以及 \s 的使用. 而最好避免使用 .*\s 作为边界,因为容易发生匹配错误的情况,如果非要使用不可,那么一定要做好验证;
H:
如果匹配的时候,某一个分组匹配到空,那么后续的分组将都会是空,这一点在调试的时候特别有用,记得哦。
使用sed分组方法进行匹配,从而输出想要的内容:
在这个例子中,我想要输出system-auth 这个pam配置文件中调用了pam_succeed_if.so模块,并且包含有condition的那个配置项的内容,而pam_succeed_if.so 模块的condition 是通过中括号进行限定的,所以就是找出: 含有pam_succeed_if.so 并且含有中括号的配置项. 具体可以用如下的分组方式:
[root@localhost ~]# sed -rn 's/(.*)(\[.*\]\s+)(pam_succeed_if.so\s+)(.*)$/\1\2\3\4/p' /etc/pam.d/system-auth #这里的模糊匹配follow 最小原则;
session [success=1 default=ignore] pam_succeed_if.so service in crond quiet use_uid
#使用grep命令验证上述结果是否正确:
[root@localhost ~]#grep pam_succeed_if.so /etc/pam.d/system-auth
auth requisite pam_succeed_if.so uid >= 1000 quiet_success
account sufficient pam_succeed_if.so uid < 1000 quiet
session [success=1 default=ignore] pam_succeed_if.so service in crond quiet use_uid
其实对于上述的需求在实际的工作中极少使用sed来实现,sed 更多的用于文件的修改,和上述的分组方法类似,正在阅读的你是否get到了呢?