Linux学习转载部分

[Linux](十二) --文件格式化处理awk,sed,pri

2019-01-15  本文已影响32人  你就像只铁甲小宝

今天学习了下文件格式处理一般常用的三个命令。
sed处理行,ack处理行内的段,printf格式化打印。

1.printf:格式化打印

printf和C语言里面的printf差不多。

格式:

printf '打印格式' 打印内容
参数:
\f: 清楚屏幕
\n: 换行
\t: 水平的tab
\v: 垂直的tab
例子1:

发现一对单引号里面是算一个字段,对应一个%s。

图片.png

像这样就全部放在单引号里面,就直接输出了。

图片.png

例子2:格式化打印last的前三行内容

printf '%s\t %15s\t %s\t\n' $(last -n 3)

  • %10意思是固定字符串长度为10。
  • $()里面接的是命令。
  • last - n 3是最近登陆的前三条信息。

若不固定长度的话,有时候对齐就会出现问题。就像这张图:


2 awk:将一行分成一段段来处理。

格式:
awk '条件 {动作} 条件 {动作}.... ' 文件
就是一个条件一个动作,当然也可以没有条件,只有动作。

我是跟着例子来学习的。

例子1:没有条件,只有动作,输出第一列跟第二列,分割符默认是空格。

cat test1.txt | awk '{print $1 "\t" $2}'

图片.png

这里的动作就是指print \$1 "\t" \$2

字段的分割是默认是空格。
$n:代表的是第n个字段,这里$1:代表第一个字段,$2:代表第二个字段。

例子2:有条件,动作,改变分隔符。

cat /tec/passwd | awk '{FS=":"} $3 < 10 {print $1 "\t" $3}'

图片.png

FS=":"可以更改分割符,默认是空格
$3 < 10 是一个动作,筛选出第三个字段小于10的行。
然后我们用print语句打印出来。

这里会发现第一行显示出来,而且没有变化。


那我们怎么解决这个问题呢,我们可以利用BEGIN这个关键字。

cat /tec/passwd | awk BEGIN '{FS=":"} $3 < 10 {print $1 "\t" $3}'

图片.png

那既然后BEGIN,那肯定有END啦。

  • BEGIN:代表执行前要执行的语句。
  • END:代表执行后要执行的语句。
  • 而{}是执行每一行时执行的语句。

2.3:一些awk里面存在的变量,其他需要的时候在去找了。

变量 意义
NF 每一行的段数数量
NR 行数
FS 分隔符

2.4: awk里面还可以使用正则表达式来进行筛选。

cat /tec/passwd | awk BEGIN '{FS=":"} $3 ~ /[[:digit:]]/ {print $1 "\t" $3}'

图片.png

格式: 字段 ~ /正则表达式/


3. sed:可以将数据进行替换,删除,新增等操作

格式:
sed [参数] [执行动作]
参数:
-n:安静模式,就是只会显示出你sed处理的那些行。
-r:可以使用扩展的正则表达式。
-i:直接修改读取文件的内容。
-e:直接在命令行进行sed的动作编辑。
执行动作:
n1,n2:代表多少行到多少行。
-a:新增,新增是新增到后面一行。
-c:替换,用其他字符串替换指定行。
-d:删除。
-i:插入,插入可以插入到前面一行。
-p:打印。
-s:替换:利用正则表达式来替换。

例子1:新增

cat test1.txt | sed '3a' 4 line

图片.png

3a代表第三行进行新增操作,删除,插入其实都差不多。

例子2:删除

图片.png

1d指删除第一行。

例子3:插入

图片.png
  • 结合刚刚的新增试试看,cat test1.txt | sed '3i' 3line命令使用后是直接第三行插入了。
  • cat test1.txt | sed '3a' 4line命令是在刚刚的第三行后面新增的。

例子4:替换

图片.png

第一行替换成了其他字母。

例子5:用正则的替换,格式 seds'/要被替换的字符串/新的字符串/g'

cat test1.txt | sed 's/[[:digit:]]/a/g'

图片.png

把数字全部换成了字母a。

把刚刚的例子前面全部加上 -n,会发现删除的不会显示,新增,插入的可以显示,但都是显示处理的那一行。
图片.png
然后 sed -i 可以直接修改文件内容。
上一篇 下一篇

猜你喜欢

热点阅读