正则表达式
2017-08-13 本文已影响0人
gogoforit
基本要领
通常是一个前面一个匹配表达式,后面接一个长度判定表达式,例如[0-9a-zA-Z\_]+
,即匹配一个任意长度的包含数字或字符串或下划线的字符串,即一个标准的Python变量。
匹配知识
\d
:匹配数字
\s
:匹配空格
\w
:匹配字母
.
: 匹配任意字符
^
:表示行开头,即以什么开头的行
$
:表示行结尾,即以什么结尾的行
^
:在括号内表示非
长度知识
*
:任意个字符,包括0个
+
:至少1字符
?
:0个或者1个字符
\d{3}
:匹配3个数字
\d{3,8}
:匹配3到8个数字
[0-9a-zA-Z]
:匹配一个包含数字或者字母的字符串
一些表达式
(.*?)
:非贪婪地匹配所有元素,按照懒惰匹配的方式,匹配尽可能短的元素