正则化表达式与通配符

2017-06-18 本文已影响0人 485b1aca799e

正则化表达式与通配符

"."符号

点符号用于匹配除换行符之外的任意一个字符。例如，r.t可以匹配rot，rut，但是不能匹配root。

例：grep 'r..t' /etc/passwd

"*"符号

"*"符号用于匹配前一个字符0次或者任意多次，比如ab*，可以匹配a、b、abb等。"*"号经常和"."号一起使用，比如”.*”代表任意长度的不包含换行的字符。

例如：”r.*t”代表查找包含字母r，后面紧跟任意长度的字符，再跟一个字母t的行。

“\{n,m\}”符号

虽然”*”可用于重复匹配前一个字符，但却不能精确的控制匹配的重复次数，使用“\{n,m\}”符号则能达到要求。

“\{n\}”符号匹配前面的字符n次，“\{n,\}”匹配前面的字符至少n次以上(含n次)。

“\{n,m\}”匹配前面的字符n到m次。

“^”符号

这个符号用于匹配开头字符的行

例如：grep ‘^root’ /etc/passwd

“$”符号

用于匹配结尾字符的行

例如：grep ‘^r.*h$’ /etc/passwd

符号“^$”则代表改行为空

“[]”符号

用于匹配方括号内出现的任一字符。用符号“-”作限定

例如：[A-Za-z]匹配所有的字母，[^A-D]代表取反即除了字母A-D以外的字母，例如：“^1[38][0-9]\{9\}”代表手机号码

“\”符号

为转义符。比如[ \- ]此时”\-”代表“-”，再如想打入一个点，则\.*代表匹配任意长度的点号。

“\<”符号和“\>”

这两个符号分别用于界定单词的左边界和右边界。

比如“\”则用于匹配以”hello”结尾的单词。

“\<\>”则用于精确匹配任意一个字符串。

例如：grep “\”

\n为换行符，\r为一个回车符，\t为一个制表符，\f为一个换页符，\s为任何空白字符，\S为任何非空白字符。

扩展的正则表达式

在使用这些扩展符号前需要使用命令egrep。

“?”符号

“?”符号用于匹配前一个字符0次或1次，所以”ro?t”仅能匹配rot或者rt.

“+”符号

“+”符号用于匹配前一个字符1次以上，所以”ro+t”就可以匹配rot、root.

“|”符号

“|”符号是”或”的意思，即多种可能的罗列

例如：^0[0-9]\{2\}-[0-9]\{8\} | ^0[0-9]\{3\}-[0-9]\{8\}

“|”符号

“()”符号通常和”|”符号连用，用于枚举一系列可替换的字符。

例如021-88888888和0511 88888888可以使用代码：^0[0-9]\{2,3\}(-| )[0-9]\{8\}

再如：h(ar|oo|ol)d可以匹配hard, hold或hood

特殊的POSIX字符，示例如下：

grep支持一类特殊的POSIX字符：

[:alnum:]文字数字字符

[:alpha:]文字字符

[:digit:]数字字符

[:graph:]非空字符（非空格、控制字符）

[:lower:]小写字符

[:cntrl:]控制字符

[:print:]非空字符（包括空格）

[:punct:]标点符号

[:space:]所有空白字符（新行，空格，制表符）

[:upper:]大写字符

[:xdigit:]十六进制数字(0-9,a-f,A-F)

例如：搜索以数字开头的行：grep ^[[:digit:]] zzbds.txt

通配符

“*”符号

“*”符号代表0个或多个字符。比如*.doc代表所有以.doc结尾的文件。A*.doc代表以字母A开头的doc文件。

“？”符号

“？”符号代表的是任意的一个字符，例如A?.doc代表的是以字母A开头，文件名第二个字母为任意字母的doc文件。

“{}”符号

可以匹配所有括号内包含的以逗号隔开的字符。

例如：ls –l {A,B,C}.doc和命令ls –l [A-C].doc列出所有以字母A,B,C开头.doc结尾的文件

嵌套功能:ls –l {[A-Z]*.doc,[0-9]??.txt}

“^”符号和“!”符号

这两个符号往往和”[]”一起使用，当出现在”[]”中的时候，代表取反。

正则化表达式与通配符

猜你喜欢

热点阅读