python3+selenium爬取网站数据
2020-11-18 本文已影响0人
爱斯基摩白
电脑环境:
Python下载:
https://www.python.org/downloads/release/python-383/
3.X.X需要下载windows XXX executable installer
image.png
-
下载完成后打开,这里我下载的是3.8.3
image.png
pip 安装与使用
Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具。
可以通过以下命令来判断是否已安装:
pip3 --version # Python3.x 版本命令
经过测试2.0的版本命令也是可以用的
pip --version # Python2.x 版本命令
image.png
安装第三方库
在进行爬取数据和解析数据前,需要在Python运行环境中下载安装第三方库requests。
需要先升级pip,否则会出现下图的报错
python -m pip install --upgrade pip
image.png
pip install requests
在Windows系统中,打开cmd界面,在该界面输入pip install requests,按回车键进行安装。
pip3 install pandas
pip3 install numpy
pip3 install bs4
pip3 install lxml
比较省事的办法是安装Anaconda套装
这里安装的,是一个优秀的 Python 软件包管理工具 pipenv
输入代码
我直接使用了自带的IDLE工具
首先执行:
pip install pipenv
安装后,请执行
pipenv install
pip3 install jupyter
此处请确认你的电脑上已经安装了 Google Chrome 浏览器。
pipenv shell
image.png
jupyter notebook
image.png
选择new python3
运行python文件
python D:\code\crawlInfo.py
需要注意的一点python代码一定要顶格写
selenium安装
pip3 install selenium
下载与chrome版本匹配的chromedriver
http://chromedriver.storage.googleapis.com/index.html
我的版本是87.0.4280.66
http://chromedriver.storage.googleapis.com/index.html?path=86.0.4240.22/
配置
解压压缩包,找到chromedriver.exe复制到chrome的安装目录(其实也可以随便放一个文件夹)。