urlparse解析url

2018-06-07  本文已影响0人  kris_lp

python3中urlparse模块和urllib模块合并,urlparse()在urllib.parse中进行调用。
urlparse()把url拆分为6个部分,scheme(协议),netloc(域名),path(路径),params(可选参数),query(连接键值对),fragment(特殊锚),并且以元组形式返回。
urlparse()具体怎么分析url呢,看看下面这个例子你就能明白了。


from urllib.parse import urlparse

url = 'https://github.com/search?q=krislp'

parse = urlparse(url)

print(parse)

输出结果:

ParseResult(scheme='https', netloc='github.com', path='/search', params='', query='q=krislp', fragment='')


urlparse()解析url的方法十分渐变,在写爬虫时非常有用,值得学习。

上一篇下一篇

猜你喜欢

热点阅读