正则
1、# shell编程之正则表达式
Linux正则:https://blog.csdn.net/bang152101/article/details/104750684/
2、s为搜索。
如:s/a/b/
搜索a将替换为b ,并只替换一次。
3、s/ *//g 将空格删除。
4、g代表搜索到的全部替换 。
5、“空格星”( " *") 代理多个空格。
6、/^$/d 删除空行。
7、# 爬虫--正则表达式 !!!!!
8、# python使用findall正则匹配出所有符合条件的字符串
import re
mystr="qqq key:www.baidu.com
key:www.tengxun.com
"
pattern = re.compile(r'key:(.*?)
')
result = pattern.findall(mystr)
print(result)
输出结果:
['www.baidu.com', 'www.tengxun.com']
9、# 用python正则表达式提取字符串
https://www.cnblogs.com/cttcarrotsgarden/p/10770205.html
import re
str = "a123b"
print re.findall(r"a(.+?)b",str)#
输出['123']
10、玩转python的正则表达式|提取字符串中的所有数字(https://blog.csdn.net/guanyonglai/article/details/89512659?utm_term=python%E4%BB%BB%E6%84%8F%E6%95%B0%E5%AD%97%E6%AD%A3%E5%88%99&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allsobaiduweb~default-3-89512659&spm=3001.4430)
s='我昨天吃饭用了45,买水果16.6骑遛遛用 了4块!dajiangyou花了6.06'
cost=re.findall(r'[1-9]+.?[0-9]*',s)
print(cost)
['45', '16.6', '4', '6.06']
s='aaa111aaa , bbb222 , 333ccc'
zz=re.findall( r'[a-z]+(\d+)[a-z]+' , s )
['111'] # 返回的是111而不是aaa111aaa,因为我们把\d括起来了,(\d+)就是一个组,
11、### [正则表达式匹配任意字符(包括换行符)-月光博客](https://www.williamlong.info/archives/5781.html)
可以用 ([\s\S]) ,也可以用 “([\d\D])”、“([\w\W]*)” 来匹配,就可以匹配包括换行符在内的任意字符
12、Python中使用re模块实现正则表达式的替换字符串操作(https://baijiahao.baidu.com/s?id=1665852143045363645&wfr=spider&for=pc)
13、解决:selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH(https://blog.csdn.net/weixin_43746433/article/details/95237254)
14、### [正则表达式()、[]、{}的区别 - Richie` - 博客园](https://www.cnblogs.com/richiewlq/p/7307581.html)
() 是为了提取匹配字符串的,表达式中有几个()就有几个相应的匹配字符串
(\s*)表示连续空格的字符串
[] 是定义匹配的字符范围。比如[a-zA-Z0-9]表示相应位置的字符要匹配英文字符和数字。[\s表示空格或者号]
{}一般是用来匹配的长度。比如\s{3}表示匹配三个空格,\s[1,3]表示匹配1到3个空格
15、# Python正则表达式匹配日期与时间
re.search(r"(\d{4}-\d{1,2}-\d{1,2})",test_date)
16、正则表达式之最短匹配(https://blog.csdn.net/zcc_0015/article/details/80744601)
https://blog.csdn.net/sinat_24070543/article/details/93209363
cookie = 'd_c0="AJAQjrv_3ROPTkO_VUROUBPm9N8nvbosWQs=|1634095612"; z_c0="2|1:0|10:1638760457|4:z_c0|92:Mi4xdmV5RkJBQUFBQUFBa0JDT3VfX2RFeVlBQUFCZ0FsVk5DYzZhWWdDc0t5UFEtampwVnFqRVBkUmlmRmREMlFZSlBR|448bb1636cfe026f2ac7e5b891194ae8dcc3b5f0e0676f6fbb8267d77270dd3b"'
# cookie_extract = re.findall(r'd_c0=(".*=|\d{10}")', cookie)[0].split(';')[0]
cookie_extract = re.findall(r'd_c0="(.*?)";', cookie)[0]
17、匹配日期时间(https://www.cnblogs.com/OnlyDreams/p/7845527.html)
date_all = re.findall(r"(\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2}:\d{1,2})",test_datetime)
for item in date_all:
print item
18、