大数据 爬虫Python AI SqlPython小哥哥Python学习

学会这二十个正则表达式,能让你少些1000行代码!

2019-06-01  本文已影响7人  轻松学Python111

正则表达式,是一个强大且高效的文本处理工具。通常情况下,通过一段表达准确的表达式,能够非常简短、快速的实现复杂业务逻辑。

因此,正则表达式通常是一个成熟开发人员的标配,可以辅助实现开发效率的极强提升。

在需要实现校验字段、字符串等内容时,通常就可以通过正则表达式实现:

image

下面是技匠整理的,经常使用到的20个正则表达式。

1、校验密码强度

密码的强度必须是包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间。

image

2、校验中文

字符串仅能是中文。

image

3、由数字、26个英文字母或下划线组成的字符串

image

4、校验E-Mail 地址

同密码一样,下面是E-mail地址合规性的正则检查语句。

image

5、校验身份证号码

下面是身份证号码的正则校验。15 或 18位。

image

6、校验日期

“yyyy-mm-dd“ 格式的日期校验,已考虑平闰年。

image

7、校验金额

金额校验,精确到2位小数。

image

8、校验手机号

下面是国内 13、15、18开头的手机号正则表达式。(可根据目前国内收集号扩展前两位开头号码)

image

9、判断IE的版本

IE目前还没被完全取代,很多页面还是需要做版本兼容,下面是IE版本检查的表达式。

image

10、校验IP-v4地址

IP4 正则语句。

image

11、校验IP-v6地址

IP6 正则语句。

image

12、检查URL的前缀

应用开发中很多时候需要区分请求是HTTPS还是HTTP,通过下面的表达式可以取出一个url的前缀然后再逻辑判断。

image

13、提取URL链接

下面的这个表达式可以筛选出一段文本中的URL。

image

14、文件路径及扩展名校验

验证windows下文件路径和扩展名(下面的例子中为.txt文件)

image

15、提取Color Hex Codes

有时需要抽取网页中的颜色代码,可以使用下面的表达式。

image

16、提取网页图片

假若你想提取网页中所有图片信息,可以利用下面的表达式。

image

17、提取页面超链接

提取html中的超链接。

image

18、查找CSS属性

通过下面的表达式,可以搜索到相匹配的CSS属性。

image

19、抽取注释

如果你需要移除HMTL中的注释,可以使用如下的表达式。

image

20、匹配HTML标签

通过下面的表达式可以匹配出HTML中的标签属性。

image

正则表达式的相关语法

下面是我找到的一张非常不错的正则表达式 Cheat Sheet,可以用来快速查找相关语法。

image
上一篇下一篇

猜你喜欢

热点阅读