sed文本处理工具

2018-06-05  本文已影响0人  毛利卷卷发

简介

sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。

功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等

常用选项

[root@centos7 app]# sed '' a
nihao hello world 
maobin zhangsan lisi
wnagwu zhaoliu
liubei zhangfei guangyu
fanjie zhanglijuan
[root@centos7 app]# sed -n '' a

[root@centos7 app]# cat d
1
[root@centos7 app]# sed -i.bak 's/1/2/g' d
[root@centos7 app]# cat d
2
[root@centos7 app]# cat d.bak 
1

地址定界

先地址定界,在编辑命令,如果不地址定界,对全文进行处理

#:指定行
$:最后一行
/pattern/:被此处模式所匹配到的每一行

#,#:1,3 1到3行
#,+#:1,3 1到4行
/pat1/,/pat2/:匹配从模式1匹配到的行到模式2匹配到的行,如果模式1匹配到,而模式2没有匹配到,那么默认就把从最后一个模式1匹配到的行到尾行一起输出
#,/pat1/:指定行到被模式1匹配到得第一行

1~2:奇数行
2~2:偶数行

[root@centos7 app]# cat -n a | sed -n '$p'
    10  nihao
[root@centos7 app]# cat -n a | sed -n '1~2p'
     1  nihao hello world 
     3  wnagwu zhaoliu
     5  fanjie zhanglijuan
     7  fanjie zhangsan
     9  fanjie
[root@centos7 app]# cat -n a | sed -n '2~2p'
     2  maobin zhangsan lisi
     4  liubei zhangfei guangyu
     6  a b c
     8  ab cf
    10  nihao

编辑命令

d:删除模式空间匹配的行,并立即启用下一轮循环
p:打印当前模式空间内容,追加到默认输出之后
a TEXT:在指定行后面追加文本,支持使用\n实现多行追加
i TEXT:在指定行前面插入文本,也可以配合\n
c TEXT:替换指定行并追加文本,也可以配合\n
w /path/somefile::保存模式匹配的行至指定文件
r /path/somefile:在指定行后依次追加文件内容
=:为模式空间中的行打印行号
!:模式空间中匹配行取反处理

s///:查找替换,支持使用其他分隔符,默认只替换行内第一个被匹配的
s///g:行内全局替换,行内所有被匹配的都将被替换
s///p:显示替换成功的行
s///w /PATH/TO/SOMEFILE:将替换成功的行保存至文件中
s/root/&superman/p:词前追加
s/root/superman&/p:词后追加

[root@centos7 app]# sed -n 's/root/&superman/p' /etc/passwd
rootsuperman:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/rootsuperman:/sbin/nologin
[root@centos7 app]# sed -n 's/root/superman&/p' /etc/passwd
supermanroot:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/supermanroot:/sbin/nologin

高级编辑命令

P:打印模式空间开端至\n内容,并追加到默认输出之前
h:把模式空间中的内容覆盖至保持空间中
H:把模式空间中的内容追加至保持空间中
g:从保持空间取出数据覆盖至模式空间
G:从保持空间取出内容追加至模式空间
x:把模式空间中的内容与保持空间中的内容进行互换
n:读取匹配到的行的下一行追加至模式空间
N:读取匹配到的行的下一行追加至模式空间
d:删除模式空间中的行
D:如果模式空间包含换行符,则删除直到第一个换行符的模式空间中的文本,并不会读取新的输
入行,而使用合成的模式空间重新启动循环。如果模式空间不包含换行符,则会像发出d命令那样
启动正常的新循环

示例

sed -n 'n;p' FILE:仅打印偶数行
sed 'n;d' FILE:仅打印奇数行
sed '1!G;h;$!d' FILE:倒序打印
sed 'N;D‘ FILE:打印最后一行
sed '$!N;$!D' FILE:打印最后两行
sed '$!d' FILE:打印最后一行
sed ‘G’ FILE:每一行后加一个空行
sed ‘g’ FILE:将所有行变为空行
sed ‘/^$/d;G’ FILE:将非空行内容之间间隔一个空行打印
sed -n '1!G;h;$p' FILE:倒序打印

练习

  1. 删除centos7系统/etc/grub2.cfg文件中所有以空白开头的行行首的空白字符

    [root@centos7 app]# cat /etc/grub2.cfg | sed 's/^[[:blank:]]\+//'
    
  2. 删除/etc/fstab文件中所有以#开头,后面至少跟一个空白字符的行的行首的#和空白字符

    [root@centos7 app]# cat /etc/fstab | sed 's/^#[[:blank:]]\+//'
    
  3. 在centos6系统/root/install.log每一行行首增加#号

    [root@centos6 ~]# cat /root/install.log | sed 's/./#&/'
    
    [root@centos6 ~]# cat /root/install.log | sed 's/^/#/'
    
  4. 在/etc/fstab文件中不以#开头的行的行首增加#号

    [root@centos7 app]# cat /etc/fstab | sed  's/^[^#]\|^$/#&/'
    
  5. 处理/etc/fstab路径,使用sed命令取出其目录名和基名

    [root@centos7 app]# echo /etc/fstab | sed 's/[^/]\+$/\n&/'
    
  6. 利用sed取出ifconfig命令中本机的IPv4地址

    [root@centos7 ~]# ifconfig ens33 | sed -n '2 s/.*inet[[:blank:]]\+//;s/[[:blank:]]\+netmask.*//p' 
    
  7. 统计centos安装光盘中Package目录下的所有rpm文件的以.分隔倒数第二个字段的重复次数

    [root@centos7 app]# ls /media/Packages/ | grep -o '[^\.]\+\.rpm$' | sort | uniq -c
    
  8. 统计/etc/init.d/functions文件中每个单词的出现次数,并排序(用grep和sed两种方法分别实现)

    [root@centos6 ~]# cat /etc/init.d/functions | grep -o '[[:alpha:]]\+' | sort | uniq -c | sort -nr
    
    [root@centos6 ~]# cat /etc/init.d/functions | sed 's/[^[:alpha:]]\+/\n/g' | sed "/^$/ d" |sort |uniq -c |sort -nr
    
  9. 将文本文件的n和n+1行合并为一行,n为奇数行

    [root@centos7 app]# cat d | sed 'N;s/\n//'
    
  10. 写一个脚本可以进行手机号码抽奖,脚本为/root/bin/choujiang.sh,当执行脚本时,会对/app/mobile.txt文件进行随机抽奖,注意手机号中的第4位及之后的3位变成*

    #!/bin/bash
    # 取手机号总数
    mobileCount=`cat $1 | wc -l`
    
    # 取随机数
    random=$[$RANDOM%$mobileCount+1]
    
    # 取出中奖手机号
    luckyMobile=`cat $1 | sed -n "$random p"`
    
    # 给中奖号码打码
    mobileBegin=`echo "$luckyMobile" | grep -o '^[0-9]\{3\}'`
    mobileEnd=`echo "$luckyMobile" | grep -o '[0-9]\{4\}$'`
    echo "$mobileBegin****$mobileEnd"
    
    [root@centos7 ~]# echo 19935126712 | sed 's/\([0-9]\{3\}\)\([0-9]\{4\}\)\([0-9]\{4\}\)/\1****\3/g'
    
上一篇 下一篇

猜你喜欢

热点阅读