python3-正则表达式(re)之获取网页全部url

2019-04-16 本文已影响0人车陂IT仔

有时候,我们需要获取网站的全部url,用作于其他测试

以sogoWeChat为例：

import re
import urllib.request

response = urllib.request.urlopen("https://weixin.sogou.com/")
html = response.read()
tag = re.findall(r'<a href="([a-zA-z]+://[^\s]*)"', str(html))
print(tag)

返回结果

推荐一个正则表达式在线验证网站：http://tool.oschina.net/regex/#

完美

热点阅读

早餐里见世界
谏言：全国的扫黑反腐

08-22浅谈对“天津爆炸事故”的看法和感想
07-04元芳你怎么看下一句
07-03陪伴是最长情的告白下一句
01-21你知道fighting是什么意思？告诉你fighting的意思
06-23深度好文：生命的意义不单是幸福
06-20深度好文：人最怕深交后的陌生

python3-正则表达式(re)之获取网页全部url

猜你喜欢

热点阅读