urlparse解析url
2018-06-07 本文已影响0人
kris_lp
python3中urlparse模块和urllib模块合并,urlparse()在urllib.parse中进行调用。
urlparse()把url拆分为6个部分,scheme(协议),netloc(域名),path(路径),params(可选参数),query(连接键值对),fragment(特殊锚),并且以元组形式返回。
urlparse()具体怎么分析url呢,看看下面这个例子你就能明白了。
from urllib.parse import urlparse
url = 'https://github.com/search?q=krislp'
parse = urlparse(url)
print(parse)
输出结果:
ParseResult(scheme='https', netloc='github.com', path='/search', params='', query='q=krislp', fragment='')
urlparse()解析url的方法十分渐变,在写爬虫时非常有用,值得学习。