Linux 之 Bash -- 管线命令

2019-08-03  本文已影响0人  熊猫人和熊猫猫

声明: 我觉得今天的这篇文章就像一篇“工具”文而且很鸡肋:归纳一些常用的管线命令和应用参数。适合有操作需求时,来查找能够帮忙解决问题的指令和参数~

学习管线命令之前要先了解管道符|,因为管线命令使用的是|这个界定符号,它和使用;的连续下达命令“很像”(关于连续命令符号“;”,Linux 之 Bash -- 数据流重导向里面刚学过,这里不再提啦~)。为了理解“|”,我们来举个例子:
我想看一下 /etc这个目录下的文件列表,但是这个目录里的东西实在太多了,直接 ls -l /etc打印到屏幕上满屏都是,往回翻操作记录都麻烦,所以可以使用ls -l /etc | less,这样ls指令输出后的内容就能够被less读取,并且利用less的功能,我们就能够前后翻动相关的信息了。这是ls -l /etc ; less达不到的效果,因为;只起到下达命令的作用,而|却起到传递标准输出STDOUT的作用,这是本质的区别。整体的管线命令可以用这个图表表示:

管线命令的处理示意图
使用时有两个注意点:

1.撷(xie)取命令: cut,grep

用过cut的伙伴都知道,cut可以提取列,可是实际上,它和grep一样都是针对文本“一行一行”来分析的,以cut -f 3 filename为例:cut文本第一行的第3段数据;cut文本第二行的第3段数据....直到文本的最后一行。最终,组成一列数据输出出来。

1.1 cut

详细聊聊cut的应用

1.2 grep

grep同样是一行一行得分析,它的做事风格很豪爽:如果当中有我想要的信息,就把这一整行都拽出来
grep支持的语法很多,还支持 正规表示法 ,可惜panda还没把正规表示法学通,在这里就只简单介绍几个参数,等到后面再及时更新

2.排序命令 sort,wc,uniq

2.1 sort

sort的大特点:可以依据不同的数据型态来排序

2.2 uniq

用于排序完成后,将重复的资料仅列出一个显示,它的一些参数:

2.3 wc 统计行数、字数、字符数

3.双向重导向 tee

tee的功能其实很简单,可以让standard output转存一份到文件内并将同样的数据继续送到屏幕去处理

tee 的工作流程(from 鸟哥)
举个例子来认识它:
ls -l | tee list.txt | less 翻译成人话:查看当前目录并且将目录内容保存到 list.txt中
看到了吧,这里tee把standard ourtput做了双向输出:一个走向 list.txt;一个走向 屏幕,不过我这里用less来查看信息
除此之外,记忆一个tee的参数:

4.字符转换命令:tr,col,join,paste,expand

4.1 tr(删除或替换文字讯息)

删除一段讯息中的文字;或者进行文字讯息的替换

注意:tr只能从标准输入中读取数据,因此使用tr时,
1.要么通过<将输入文件重定向到标准输入;

2.要么通过管道符|读入数据

4.2 col(用对等的空格键取代tab键)

最常用的操作:通过使用参数-x,将[tab]按键取代成为对应的 相同长度的 空格键
eg:cat -A list.txt (如果list.txt 中有tab键,就会看到很多^I的符号;cat -A可以显示出所有的特殊按键)
再试试cat list.txt | col -x | cat -A 这样打印到屏幕的输出就美观多了
不要光说不做哦~just do it ~

4.3 join(根据相关性合并文件)

join这个小命令只能处理2个文件之间的数据:两个文件当中,有“相同数据”的那一行,才将他们加在一起
例如 /etc/passwd 和 /etc/shadow这两个文件(先看他们的文本特点):

寻找他们的相同点
可以看到,这两个文本的分隔符都是:,同时第一个字段的内容都相同(都是 root,bin,daemon),如果我们想要把两个文本中不同的数据合在一起,就可以使用join将他们变成这个样子:join -t ':' /etc/passwd /etc/shadow | head -n 3
合并后的样子
认识join的一些参数:join [-ti12] file1 file2

注意:插播一下使用join时的注意点

1.需要处理的文件以防顺序错乱,最好排序并去重后再join;
2.指定要整合的字段要相同啊!

而刚开始了解join时,没有数字参数的这个指令是怎么执行的?join -t ':' /etc/passwd /etc/shadow | head -n 3
实际上,👆它只是进行了参数的省略而已,linux默认以两个文件的第1个字段进行分析和整合,完整的它应该是这个样子join -t ':' -1 1 /etc/passwd -2 1 /etc/shadow | head -n 3
怎么样?是不是有点头晕?哈哈,记住就好啦~
总之,join在处理两个相关的数据文件时是非常有帮助的,例如/etc/passwd和/etc/shadow以账号为相关性,而/etc/passwd和/ec/group以所谓的GID(账号的数字定义)为相关性,通过join可以把这些有用的数据放在一起。

4.4 paste(简单粗暴得合并文件)

和join作用类似,也是将两个文件的数据贴在一起,但是它的方式简单粗暴,不会去比较内容是否相关,而是直接将行号相同的字段拼在一起,默认以tab键分隔。
工作模式 paste [-d] file1 file2

4.5 expand(用空格取代tab键)

还记得上面提到的col -x吗,它可以将tab键取代为相同长度的空格键。expand和它作用类似,不过expand可以自由设定tab键取代成空格键的个数,所以功能是比col -x更强大的。
常见的工作模式 expand [-t] file

小插曲:** 如果我想让空格键转成tab键怎么办? **
答案:使用 unexpand

5. 分区命令:split

split可以根据文件大小或行数来分区,从而将大文件分成小文件。
(在我们常用的windows里面可是个大问题啊,而进入linux,我们可以很方便得使用split啦~)
常用工作模式: split [-bl] file PREFIX
常用选项和参数

6.参数代换:xargs

xargs 可以用来产生某个指令的参数,可读入stdin的数据,并且以空格符或断行字符作为分辨,将stdin的资料分隔成arguments(参数)。

xargs听起来很吓人,难理解也是因为实践与想象有差距。如果学着应用它,就会发现,它其实也是很简单的一个命令,don't panic~
常见工作模式: xargs [-0epn] command
选项与参数:

实践前热身(可以试着在自己的集群上操作)

下面分几步介绍id,同时衬托一下xargs存在的“魅力”!
id 指令可以查询用户的UID/GID等信息 eg: id root

  • step 1 认识id只接受一个参数的局限性
    id $(cut -d ':' -f 1 /etc/passwd | head -n 3)
    翻译成人话: 将/etc/passwd中的第一列的前三行取出来,并且使用id指令查看信息
    这里通过$(cut -d ':' -f 1 /etc/passwd | head -n 3)预先取得了参数,但是因为id只能接受一个参数,因此它会在linux系统里报错。
    -step 2 认识 id并不是管线命令的局限性
    cut -d ':' -f 1 /etc/passwd | head -n 3 | id
    最终你会发现,你查了自己!因为id不是管线命令,它是没有办法接收|前面的信息的。因此cut -d ':' -f 1 /etc/passwd | head -n 3 | id 的执行效果 就等于 直接在linux命令行中输入id 所执行的结果。

这可肿么办? xargs来了就有了办法~

上一篇下一篇

猜你喜欢

热点阅读