正则化表达式与通配符

2017-06-18  本文已影响0人  485b1aca799e

正则化表达式与通配符

"."符号

点符号用于匹配除换行符之外的任意一个字符。例如,r.t可以匹配rot,rut,但是不能匹配root。

例:grep 'r..t' /etc/passwd

"*"符号

"*"符号用于匹配前一个字符0次或者任意多次,比如ab*,可以匹配a、b、abb等。"*"号经常和"."号一起使用,比如”.*”代表任意长度的不包含换行的字符。

例如:”r.*t”代表查找包含字母r,后面紧跟任意长度的字符,再跟一个字母t的行。

“\{n,m\}”符号

虽然”*”可用于重复匹配前一个字符,但却不能精确的控制匹配的重复次数,使用“\{n,m\}”符号则能达到要求。

“\{n\}”符号匹配前面的字符n次,“\{n,\}”匹配前面的字符至少n次以上(含n次)。

“\{n,m\}”匹配前面的字符n到m次。

“^”符号

这个符号用于匹配开头字符的行

例如:grep ‘^root’ /etc/passwd

“$”符号

用于匹配结尾字符的行

例如:grep ‘^r.*h$’ /etc/passwd

符号“^$”则代表改行为空

“[]”符号

用于匹配方括号内出现的任一字符。用符号“-”作限定

例如:[A-Za-z]匹配所有的字母,[^A-D]代表取反即除了字母A-D以外的字母,例如:“^1[38][0-9]\{9\}”代表手机号码

“\”符号

为转义符。比如[ \- ]此时”\-”代表“-”,再如想打入一个点,则\.*代表匹配任意长度的点号。

“\<”符号和“\>”

这两个符号分别用于界定单词的左边界和右边界。

比如“\”则用于匹配以”hello”结尾的单词。

“\<\>”则用于精确匹配任意一个字符串。

例如:grep “\”

\n为换行符,\r为一个回车符,\t为一个制表符,\f为一个换页符,\s为任何空白字符,\S为任何非空白字符。

扩展的正则表达式

在使用这些扩展符号前需要使用命令egrep。

“?”符号

“?”符号用于匹配前一个字符0次或1次,所以”ro?t”仅能匹配rot或者rt.

“+”符号

“+”符号用于匹配前一个字符1次以上,所以”ro+t”就可以匹配rot、root.

“|”符号

“|”符号是”或”的意思,即多种可能的罗列

例如:^0[0-9]\{2\}-[0-9]\{8\} | ^0[0-9]\{3\}-[0-9]\{8\}

“|”符号

“()”符号通常和”|”符号连用,用于枚举一系列可替换的字符。

例如021-88888888和0511 88888888可以使用代码:^0[0-9]\{2,3\}(-| )[0-9]\{8\}

再如:h(ar|oo|ol)d可以匹配hard, hold或hood

特殊的POSIX字符,示例如下:

grep支持一类特殊的POSIX字符:

[:alnum:]文字数字字符

[:alpha:]文字字符

[:digit:]数字字符

[:graph:]非空字符(非空格、控制字符)

[:lower:]小写字符

[:cntrl:]控制字符

[:print:]非空字符(包括空格)

[:punct:]标点符号

[:space:]所有空白字符(新行,空格,制表符)

[:upper:]大写字符

[:xdigit:]十六进制数字(0-9,a-f,A-F)

例如:搜索以数字开头的行:grep ^[[:digit:]] zzbds.txt

通配符

“*”符号

“*”符号代表0个或多个字符。比如*.doc代表所有以.doc结尾的文件。A*.doc代表以字母A开头的doc文件。

“?”符号

“?”符号代表的是任意的一个字符,例如A?.doc代表的是以字母A开头,文件名第二个字母为任意字母的doc文件。

“{}”符号

可以匹配所有括号内包含的以逗号隔开的字符。

例如:ls –l {A,B,C}.doc和命令ls –l [A-C].doc列出所有以字母A,B,C开头.doc结尾的文件

嵌套功能:ls –l {[A-Z]*.doc,[0-9]??.txt}

“^”符号和“!”符号

这两个符号往往和”[]”一起使用,当出现在”[]”中的时候,代表取反。

上一篇下一篇

猜你喜欢

热点阅读