「Linux基础」awk中单双引号的区别

2021-02-19  本文已影响0人  卖萌哥

在服务器共享群里有个朋友贴了下面这张图并艾特了我问: 萌老师, 为啥awk在使用单双引号时结果会不一样呢?
在这张图里, 当awk的最外层使用双引号时, 命令没有任何的返回结果, 但当把双引号替换成单引号的时候, 就能正常返回结果了. 这是怎么回事呢?

单双引号为啥不一样呢

之前我在给生信技能树的生信入门12期学员讲课时没有给大家展开仔细讲这个单双引号的区别, 只在最后一节课讲自定义变量的时候提了一下:

当我定义一个$a为gene时, 用单引号和双引号扩起来分别echo出来, 会发现单引号里$a就是本体, 而双引号里的$a则会被解释(扩展)为对应的变量内容.

举个例子

当时给出的解释是:

单引号:变量不会被解释
双引号:变量被解释

在awk的部分没有具体讲是因为这事儿太细致了, 只要当作这是一种“固定用法”, 养成习惯最外层用单引号内层用双引号就完事儿了, 就能避免绝大多数情况下的错误.


那既然现在有人提问了, 那就再解释一下.
在中文世界里找了一圈, 不太有合适的解释帖子. 于是就到英文世界里去搜了一圈, 找到下面两个链接:

  1. Why does using double quotes to enclose awk's action statements produce different results than when using single quotes to enclose them?
  2. Shell Quoting Issues

第一个是个问询贴, 第二个是GNU官方的gawk的官方手册.

要说区别的话就是shell和awk对单双引号的处理是不一样的.
在第一个链接的问询贴里有这么一句:

If you use double quotes the $2 gets replaced by the shell before awk is called.

这句话意思就是, 如果你用双引号, shell会在awk处理之前就把$2给展开了, 那么awk识别的时候就出错了, 就得不到你要的结果了. 为了避免这种shell把awk活儿给提前抢了的问题, 最外层用单引号就好了.

回到最前面的截图, 在①中, 因为用了双引号, awk后面的$0先被shell解释了(一般专业词汇应该叫展开, extend). 这时候$0不再是awk里的“所有字段”(代表整个文本行)的含义, 而是一个叫做“$0”的变量(就跟前面举例的$a一样). 这就是为啥最后awk回没有结果的原因.

在②中, 因为使用的单引号, $0不会被shell展开, 其含义仍是awk内的含义.

如果大家对awk比较感兴趣的话, 有一些awk编程相关的书籍可以查询的.
例如介绍sed和awk的书: 《sed与awk》或者是《awk programming》

sed与awk
awk programming
上一篇 下一篇

猜你喜欢

热点阅读