python正则表达式

2016-11-18  本文已影响0人  zhouminghao

python正则表达式==========

\w可以匹配一个字母或数字

.可以匹配任意字符

*表示任意个字符(包括0个),用+表示至少一个字符,用?表示0个或1个字符,用{n}表示n个字符,用{n,m}表示n-m个字符:

\d{3}表示匹配3个数字,例如'010'

\s+表示至少有一个空格

\d{3,8}表示3-8个数字,例如'1234567'

[0-9a-zA-Z\_]可以匹配一个数字、字母或者下划线;

[0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'a100','0_Z','Py3000'

a-zA-Z\_][0-9a-zA-Z\_]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)

A|B可以匹配A或B,所以(P|p)ython可以匹配'Python'或者'python'

^表示行的开头,^\d表示必须以数字开头

$表示行的结束,\d$表示必须以数字结束。

py也可以匹配'python',但是加上^py$就变成了整行匹配,就只能匹配'py'了

re.match(r'正则表达式', test)

match()方法判断是否匹配,如果匹配成功,返回一个Match对象,否则返回None

re.split(r'\s+', 'a b  c')

['a', 'b', 'c']

>>> re.split(r'[\s\,]+', 'a,b, c  d')

['a', 'b', 'c', 'd']

>>> import re

# 编译:

>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')

# 使用:

>>> re_telephone.match('010-12345').groups()

('010', '12345')

上一篇下一篇

猜你喜欢

热点阅读