Shell基石:模式匹配
模式匹配在Shell脚本中的运用很广泛。
举几个栗子:
"三元运算符"
#!/usr/bin/env bash
x=${1:-"hello"}
echo $x
# 打印第一个参数(默认hello)
在上述例子中,x=${1:-"hello"}
中的 1:-
可以理解为三元运算符的匹配条件,表达的含义是,如果参数列表中 $1
的值不为空,则 x
值为 $1
,否则值为"hello"。表达式中的 -
则可以理解为是该表达式的匹配模式,另外还有 +
=
?
三种模式:
-
${var:-string}和${var:=string}:若变量var为空,则用在命令行中用string来替换${var:-string},否则变量var不为空时,则用变量var的值来替换${var:-string};对于${var:=string}的替换规则和${var:-string}是一样的,所不同之处是${var:=string}若var为空时,用string替换${var:=string}的同时,把string赋给变量var: ${var:=string}很常用的一种用法是,判断某个变量是否赋值,没有的话则给它赋上一个默认值。
-
${var:+string}的替换规则和上面的相反,即只有当var不是空的时候才替换成string,若var为空时则不替换或者说是替换成变量 var的值,即空值。(因为变量var此时为空,所以这两种说法是等价的)
-
${var:?string}替换规则为:若变量var不为空,则用变量var的值来替换${var:?string};若变量var为空,则把string输出到标准错误中,并从脚本中退出。我们可利用此特性来检查是否设置了变量的值。
补充扩展:在上面这五种替换结构中string不一定是常值的,可用另外一个变量的值或是一种命令的输出。
模式匹配记忆方法:
# 是去掉左边(在键盘上#在$之左边)
% 是去掉右边(在键盘上%在$之右边)
# 和 % 中的单一符号是最小匹配,两个相同符号是最大匹配。
${var%pattern}, ${var%%pattern}, ${var#pattern}, ${var##pattern}
- 第一种模式:${variable%pattern},这种模式时,shell 在 variable 中查找,看它是否一给的模式 pattern 结尾,如果是,就从命令行把 variable 中的内容去掉右边最短的匹配模式;
- 第二种模式: ${variable%%pattern},这种模式时,shell 在 variable 中查找,看它是否一给的模式 pattern 结尾,如果是,就从命令行把 variable 中的内容去掉右边最长的匹配模式;
- 第三种模式:${variable#pattern} 这种模式时,shell 在 variable 中查找,看它是否一给的模式 pattern 开始,如果是,就从命令行把 variable 中的内容去掉左边最短的匹配模式;
- 第四种模式: ${variable##pattern} 这种模式时,shell 在 variable 中查找,看它是否一给的模式 pattern 结尾,如果是,就从命令行把 variable 中的内容去掉右边最长的匹配模式;
- 这四种模式中都不会改变 variable 的值,其中,只有在 pattern 中使用了 * 匹配符号时,% 和 %%,# 和 ## 才有区别。结构中的 pattern 支持通配符,* 表示零个或多个任意字符,? 表示仅与一个任意字符匹配,[...] 表示匹配中括号里面的字符,[!...] 表示不匹配中括号里面的字符。
# var=testcase
# echo $var
testcase
# echo ${var%s*e}
testca
# echo $var
testcase
# echo ${var%%s*e}
te
# echo ${var#?e}
stcase
# echo ${var##?e}
stcase
# echo ${var##*e}
# echo ${var##*s}
e
# echo ${var##test}
case
字符串提取和替换
${var:num},${var:num1:num2},${var/pattern/pattern},${var//pattern/pattern}
- 第一种模式:${var:num},这种模式时,shell在var中提取第num个字符到末尾的所有字符。若num为正数,从左边0处开始;若num为负数,从右边开始提取字串,但必须使用在冒号后面加空格或一个数字或整个num加上括号,如${var: -2}、${var:1-3}或${var:(-2)}。
- 第二种模式:${var:num1:num2},num1是位置,num2是长度。表示从$var字符串的第$num1个位置开始提取长度为$num2的子串。不能为负数。
- 第三种模式:${var/pattern/pattern}表示将var字符串的第一个匹配的pattern替换为另一个pattern。
- 第四种模式:${var//pattern/pattern}表示将var字符串中的所有能匹配的pattern替换为另一个pattern。
var=/home/centos
# echo $var
/home/centos
# echo ${var:5}
/centos
# echo ${var: -6}
centos
# echo ${var:(-6)}
centos
# echo ${var:1:4}
home
# echo ${var/o/h}
/hhme/centos
# echo ${var//o/h}
/hhme/cenths
end.