python3+selenium爬取网站数据

2020-11-18  本文已影响0人  爱斯基摩白

电脑环境:

image.png
Python下载:
https://www.python.org/downloads/release/python-383/
3.X.X需要下载windows XXX executable installer
image.png
  1. 下载完成后打开,这里我下载的是3.8.3


    image.png

    pip 安装与使用
    Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具。
    可以通过以下命令来判断是否已安装:
    pip3 --version # Python3.x 版本命令
    经过测试2.0的版本命令也是可以用的
    pip --version # Python2.x 版本命令


    image.png
    安装第三方库
    在进行爬取数据和解析数据前,需要在Python运行环境中下载安装第三方库requests。

    需要先升级pip,否则会出现下图的报错
    python -m pip install --upgrade pip


    image.png
    pip install requests
    在Windows系统中,打开cmd界面,在该界面输入pip install requests,按回车键进行安装。
    pip3 install pandas
    pip3 install numpy
    pip3 install bs4
    pip3 install lxml
    比较省事的办法是安装Anaconda套装
    这里安装的,是一个优秀的 Python 软件包管理工具 pipenv

输入代码
我直接使用了自带的IDLE工具
首先执行:
pip install pipenv
安装后,请执行
pipenv install
pip3 install jupyter
此处请确认你的电脑上已经安装了 Google Chrome 浏览器。
pipenv shell


image.png

jupyter notebook


image.png

选择new python3

运行python文件
python D:\code\crawlInfo.py
需要注意的一点python代码一定要顶格写
selenium安装
pip3 install selenium
下载与chrome版本匹配的chromedriver
http://chromedriver.storage.googleapis.com/index.html
我的版本是87.0.4280.66

image.png

http://chromedriver.storage.googleapis.com/index.html?path=86.0.4240.22/
配置
解压压缩包,找到chromedriver.exe复制到chrome的安装目录(其实也可以随便放一个文件夹)。

上一篇下一篇

猜你喜欢

热点阅读