正则表达式与通配符
2020-11-17 本文已影响0人
平静_b99e
1. 正则表达式与通配符
- 正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
- 通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。
2. 通配符:
通配符 | 作用 |
---|---|
? | 匹配一个任意字符 |
* | 匹配0个或任意多个字符,也就是可以匹配任何内容 |
[] | 匹配中括号中任意一个字符 |
[-] | 匹配中括号中任意一个字符,-代表一个范围 |
[^] | 逻辑非,表示匹配不是中括号内的一个字符 |
3. 基本正则表达式
元字符 | 作用 |
---|---|
* | 前一个字符匹配0次或任意多次。 |
. | 匹配除了换行符外任意一个字符。 |
^ | 匹配行首。例如:^hello会匹配以hello开关的行。 |
$ | 匹配行尾。例如:hello$会匹配以hello结尾的行。 |
[] | 匹配中括号中指定的任意一个字符,只匹配一个字符。例如:[aeiou]匹配任意一个元音字符,[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字母和一位数字构成的两位字符。 |
[^] | 匹配除中括号的字符以外的任意一个字符。例如:[0-9]匹配任意一位非数字字符,[a-z]匹配任意一位非小写字母。 |
\ | 转义符。用于取消,将特殊符号的含义取消。 |
\{n\} | 表示其前面的字符恰好出现n次。例如:[0-9]\{4\}匹配4位数字,[1][3-8][0-9]\{9\}匹配手机号码。 |
\{n,\} | 表示其前面的字符出现不小于n次。例如:[0-9]\{2,\}表示两位及以上的数字。 |
\{n,m\} | 表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]\{6,8\}匹配6到8位的小写字母。 |
例子:
- “*”前一个字符匹配0次,或任意多次
# 匹配所有内容,包括空白行
grep "a*" test_rule.txt
# 匹配至少包含一个a的行
grep "aa*" test_rule.txt
# 匹配至少包含两个连续a的字符串
grep "aaa*" test_rule.txt
# 匹配最少包含4个连接a的字符串
grep "aaaaa*" test_rule.txt
- “.”匹配除换行符外任意一个字符
# "s..d" 会匹配在s和d这两个字母之间一定有两个字符的单词
grep "s..d" test_rule.txt
# 匹配在s和d字母之间有任意字符
grep "s.*d" text_rule.txt
# 匹配所有内容
grep ".*" test_rule.txt
- “^”匹配行首,“$”匹配行尾
# 匹配以大写“M”开关的行
grep "^M" test_rule.txt
# 匹配以小写“n”结尾的行
grep "n$" test_rule.txt
# 匹配空白行
grep "^$" test_rule.txt
- “[]”匹配中括号中指定的任意一个字符,只匹配一个字符
# 匹配s和i字母中,要不是a、要不是o
grep "s[ao]id" test_rule.txt
# 匹配任意一个数字
grep "[0-9]" test_rule.txt
# 匹配用小写字母开头的行
grep "^[a-z]" test_rule.txt
- “[^]”匹配除中括号的字符以外的任意一个字符
# 匹配不用小写字母开关的行
grep "^[^a-z]" test_rule.txt
# 匹配不用字母开头的行
grep "^[^a-zA-Z]" test_rule.txt
- “\”转义符
# 匹配使用“.”结尾的行
grep "\.$" test_rule.txt
- “\{n\}”表示其前面的字符恰好出现n次
# 匹配a字母连续出现3次的字符串
grep "a\{3\}" test_rule.txt
# 匹配包含连续的三个数字的字符串
grep "[0-9]\{3\}" test_rule.txt
- “\{n,m\}” 匹配其前面的字符至少出现n次,最多出现m次
# 匹配在字母s和i之间有最少一个a,最多3个a
grep "sa\{1,3\}i" test_rule.txt