Python爬虫-常用库
2019-07-30 本文已影响0人
坤哥爱卿
首先安装Anaconda软件,这个包含了Python和pip以及很多的第三方库。
下载地址:https://www.anaconda.com/distribution/
下面介绍各种第三方库及安装方式:
1.urllib 和 re (自带库)
验证方法:
2.requests (pip安装)
requests官网:https://2.python-requests.org/en/master/
3.selenium(pip安装) 和 chromeDriver(HomeBrew安装)---- 有界面浏览器,selenium 自动化测试的
chromeDriver安装方式:https://www.jianshu.com/p/a9df5135a3a3
验证方法:
driver.page_source查看网页源码
4.phantomjs(搜索安装)----无界面浏览器
phantomjs下载地址:https://phantomjs.org/download.html
验证方法:
5.lxml (pip安装)---- xpass解析方式
安装方式一:pip install lxml
安装方式二:
(1)先去百度lxml pypi 下载下来
(2)pip install 下载文件的路径
6.beautifulsoup(pip安装)----网页解析库,依赖于lxml
验证方法:
7.pyquery(pip安装) ----网页解析库,语法与jQuery一致
pyquery官网:https://pythonhosted.org/pyquery/
验证方法: