python爬虫Freecodecamp生活不易 我用python

正则表达式

2016-07-29  本文已影响47人  德坤丨

今天在学习python爬虫爬取妹子图,需要用到正则表达式。感觉一头雾水,于是谷歌了一篇关于讲解正则表达式入门

这篇文章简洁明了,照着敲代码解决了今天的爬取的难题。正则表达式基础部分主要需要用到三部分  元字符

. 匹配除换行符以外的任意字符

\w 匹配字母或数字或下划线或汉字

\s 匹配任意的空白符

\d 匹配数字

\b 匹配单词的开始或结束

^ 匹配字符串的开始

$ 匹配字符串的结束   


第二部分就是由常用二限定符来组成了,大体包括以下几个

* 重复零次或更多次

+ 重复一次或更多次

? 重复零次或一次

{n} 重复n次

{n,} 重复n次或更多次

{n,m} 重复n到m次


第三部分就是由常用反义代码来组成了

\W 匹配任意不是字母,数字,下划线,汉字的字符

\S 匹配任意不是空白符的字符

\D 匹配任意非数字的字符

\B 匹配不是单词开头或结束的位置

[^x] 匹配除了x以外的任意字符

[^aeiou] 匹配除了aeiou这几个字母以外的任意字符


个人认为学习正则表达式,只要记住这些常用的就足够了,遇到基础无法解决的,就借助搜索引擎再配合基础部分就可以匹配出来了,主要还是熟能生巧!

上一篇下一篇

猜你喜欢

热点阅读