[Linux](十二) --文件格式化处理awk,sed,pri
今天学习了下文件格式处理一般常用的三个命令。
sed处理行,ack处理行内的段,printf格式化打印。
1.printf:格式化打印
printf和C语言里面的printf差不多。
格式:
printf '打印格式' 打印内容 | |
---|---|
参数: | |
\f: | 清楚屏幕 |
\n: | 换行 |
\t: | 水平的tab |
\v: | 垂直的tab |
例子1:
图片.png发现一对单引号里面是算一个字段,对应一个%s。
图片.png像这样就全部放在单引号里面,就直接输出了。
例子2:格式化打印last的前三行内容
printf '%s\t %15s\t %s\t\n' $(last -n 3)
%10意思是固定字符串长度为10。
$()里面接的是命令。
last - n 3是最近登陆的前三条信息。
若不固定长度的话,有时候对齐就会出现问题。就像这张图:
2 awk:将一行分成一段段来处理。
格式:
awk '条件 {动作} 条件 {动作}.... ' 文件
就是一个条件一个动作,当然也可以没有条件,只有动作。
我是跟着例子来学习的。
例子1:没有条件,只有动作,输出第一列跟第二列,分割符默认是空格。
cat test1.txt | awk '{print $1 "\t" $2}'
这里的动作就是指print \$1 "\t" \$2
字段的分割是默认是空格。
$n:代表的是第n个字段,这里$1:代表第一个字段,$2:代表第二个字段。
例子2:有条件,动作,改变分隔符。
cat /tec/passwd | awk '{FS=":"} $3 < 10 {print $1 "\t" $3}'
FS=":"可以更改分割符,默认是空格
$3 < 10 是一个动作,筛选出第三个字段小于10的行。
然后我们用print语句打印出来。
这里会发现第一行显示出来,而且没有变化。
-
能显示出来的原因是,第一行的第三个字段为空,符合条件。
-
没有变化的原因是,读入第一行的时候还是以空格为分隔符。
那我们怎么解决这个问题呢,我们可以利用BEGIN这个关键字。
cat /tec/passwd | awk BEGIN '{FS=":"} $3 < 10 {print $1 "\t" $3}'
那既然后BEGIN,那肯定有END啦。
- BEGIN:代表执行前要执行的语句。
- END:代表执行后要执行的语句。
- 而{}是执行每一行时执行的语句。
2.3:一些awk里面存在的变量,其他需要的时候在去找了。
变量 | 意义 |
---|---|
NF | 每一行的段数数量 |
NR | 行数 |
FS | 分隔符 |
2.4: awk里面还可以使用正则表达式来进行筛选。
cat /tec/passwd | awk BEGIN '{FS=":"} $3 ~ /[[:digit:]]/ {print $1 "\t" $3}'
格式: 字段 ~ /正则表达式/
3. sed:可以将数据进行替换,删除,新增等操作
格式:
sed [参数] [执行动作]
参数:
-n:安静模式,就是只会显示出你sed处理的那些行。
-r:可以使用扩展的正则表达式。
-i:直接修改读取文件的内容。
-e:直接在命令行进行sed的动作编辑。
执行动作:
n1,n2:代表多少行到多少行。
-a:新增,新增是新增到后面一行。
-c:替换,用其他字符串替换指定行。
-d:删除。
-i:插入,插入可以插入到前面一行。
-p:打印。
-s:替换:利用正则表达式来替换。
例子1:新增
cat test1.txt | sed '3a' 4 line
3a代表第三行进行新增操作,删除,插入其实都差不多。
例子2:删除
图片.png1d指删除第一行。
例子3:插入
图片.png
- 结合刚刚的新增试试看,
cat test1.txt | sed '3i' 3line
命令使用后是直接第三行插入了。cat test1.txt | sed '3a' 4line
命令是在刚刚的第三行后面新增的。
例子4:替换
图片.png第一行替换成了其他字母。
例子5:用正则的替换,格式 seds'/要被替换的字符串/新的字符串/g'
cat test1.txt | sed 's/[[:digit:]]/a/g'
把数字全部换成了字母a。