正则

2021-11-22  本文已影响0人  无量儿

1、# shell编程之正则表达式

Linux正则:https://blog.csdn.net/bang152101/article/details/104750684/
2、s为搜索。

如:s/a/b/

搜索a将替换为b ,并只替换一次。

3、s/ *//g 将空格删除。

4、g代表搜索到的全部替换 。

5、“空格星”( " *") 代理多个空格。

6、/^$/d 删除空行。

7、# 爬虫--正则表达式 !!!!!

8、# python使用findall正则匹配出所有符合条件的字符串
import re
mystr="qqq key:www.baidu.com
key:www.tengxun.com
"
pattern = re.compile(r'key:(.*?)
')
result = pattern.findall(mystr)
print(result)

输出结果:

['www.baidu.com', 'www.tengxun.com']

9、# 用python正则表达式提取字符串
https://www.cnblogs.com/cttcarrotsgarden/p/10770205.html

import re
str = "a123b"
print re.findall(r"a(.+?)b",str)#
输出['123']

10、玩转python的正则表达式|提取字符串中的所有数字(https://blog.csdn.net/guanyonglai/article/details/89512659?utm_term=python%E4%BB%BB%E6%84%8F%E6%95%B0%E5%AD%97%E6%AD%A3%E5%88%99&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-3-89512659&spm=3001.4430)

s='我昨天吃饭用了45,买水果16.6骑遛遛用 了4块!dajiangyou花了6.06'
cost=re.findall(r'[1-9]+.?[0-9]*',s)
print(cost)
['45', '16.6', '4', '6.06']

s='aaa111aaa , bbb222 , 333ccc'
zz=re.findall( r'[a-z]+(\d+)[a-z]+' , s )

['111'] # 返回的是111而不是aaa111aaa,因为我们把\d括起来了,(\d+)就是一个组,

11、### [正则表达式匹配任意字符(包括换行符)-月光博客](https://www.williamlong.info/archives/5781.html
可以用 ([\s\S]) ,也可以用 “([\d\D])”、“([\w\W]*)” 来匹配,就可以匹配包括换行符在内的任意字符

12、Python中使用re模块实现正则表达式的替换字符串操作(https://baijiahao.baidu.com/s?id=1665852143045363645&wfr=spider&for=pc

图片.png

13、解决:selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH(https://blog.csdn.net/weixin_43746433/article/details/95237254

14、### [正则表达式()、[]、{}的区别 - Richie` - 博客园](https://www.cnblogs.com/richiewlq/p/7307581.html
() 是为了提取匹配字符串的,表达式中有几个()就有几个相应的匹配字符串

(\s*)表示连续空格的字符串

[] 是定义匹配的字符范围。比如[a-zA-Z0-9]表示相应位置的字符要匹配英文字符和数字。[\s表示空格或者号]

{}一般是用来匹配的长度。比如\s{3}表示匹配三个空格,\s[1,3]表示匹配1到3个空格

15、# Python正则表达式匹配日期与时间
re.search(r"(\d{4}-\d{1,2}-\d{1,2})",test_date)

16、正则表达式之最短匹配(https://blog.csdn.net/zcc_0015/article/details/80744601
https://blog.csdn.net/sinat_24070543/article/details/93209363

cookie = 'd_c0="AJAQjrv_3ROPTkO_VUROUBPm9N8nvbosWQs=|1634095612"; z_c0="2|1:0|10:1638760457|4:z_c0|92:Mi4xdmV5RkJBQUFBQUFBa0JDT3VfX2RFeVlBQUFCZ0FsVk5DYzZhWWdDc0t5UFEtampwVnFqRVBkUmlmRmREMlFZSlBR|448bb1636cfe026f2ac7e5b891194ae8dcc3b5f0e0676f6fbb8267d77270dd3b"'
# cookie_extract = re.findall(r'd_c0=(".*=|\d{10}")', cookie)[0].split(';')[0]
cookie_extract = re.findall(r'd_c0="(.*?)";', cookie)[0]

17、匹配日期时间(https://www.cnblogs.com/OnlyDreams/p/7845527.html
date_all = re.findall(r"(\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2}:\d{1,2})",test_datetime)
for item in date_all:
print item

18、

上一篇下一篇

猜你喜欢

热点阅读