python学习笔记-tip56(正则表达式)

2018-12-01  本文已影响6人  黑键手记

前言

还记得我第一份工作,是做数据采集、数据处理,其中数据采集的工作就是利用爬虫去爬取 相关网站的一些特殊字段,爬虫需要用「正则表达式」来对我想采集的 "特殊的字段" 进行匹配,匹配成功,则将该字段存储到本地的数据库,然后接着轮询。

现在还是挺想念第一家公司的...

好了,今天先把正则表达式的一些特殊的规则先列举一下吧

正则的规则

正因为想要对 ”一些特殊的字段“ 进行匹配,然后加以利用,所以就有了「正则表达式的概念」,比如我们通常使用 /w 匹配一个字母或数字,使用 /d 匹配一个数字,等等很多,现在一一列举一下。

以上都是单个符号,字母,数字,怎么体现n个呢

或者关系

行的开头

行的结尾

ok ,大致规则就是这样喽,那么下面我们先来看几个复杂的「正则表达式」来练练手

练练手

题目:\d{3}\s+\d{3,8}

答:3个数字 至少一个空格 3-8位的数字
比如 012 1234 这样的数字就是匹配的。

几个常用的正则表达式

总结

正则表达式很简单,只需要记得上面列举的那些特殊字符即可,是不是很简单,赶快写一个手机号码的正则吧~~

上一篇 下一篇

猜你喜欢

热点阅读