爬虫环境的配置

2018-09-29  本文已影响0人  高金01

IDE的安装

IDE我用的是VS code,也用过pycharm(但是电脑配置不行,比较卡)

VScode安装教程在这,写的蛮清楚的

然后安装一个python的插件就行
见如下截图

image

包的安装

配置pip源,不配置的话下载速度很慢

windows:在当前用户根目录下,创建.pip和这个文件夹,然后在里面新建一个文件pip.in 里面的内容为

[global]
index-url = http://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host=mirrors.aliyun.com

截图如下(我当前用户名为kimga

image

linux:在~/.pip/pip.conf文件中添加或修改(内容同上)

包的安装

直接pip install 包的名字
pip install requests

依次安装如下4个包

  1. requests
  2. lxml
  3. ipython
  4. jupyter

如果发现报错的话,

windows下pip install lxml 很少能安装成功。。。

image

那我们怎么做呢?

  1. 打开Unofficial Windows Binaries for Python Extension Packages这个网址

  2. ctrl+ F,然后在搜索框内输入lxml

    image
  3. 找到与你系统版本相同的包,下载

    • 我的python版本是2.7,系统是64位的,所以我选择lxml‑3.7.3‑cp27‑cp27m‑win_amd64.whl
      image
  4. 下载完成后在你下载的目录下打开cmd命令行

    • 这边有个小技巧是,找到你下载的目录后,按住shift不放,然后空白处右键,会多出来一个在此处打开命令窗口,不用再慢慢的cd过来
    image
  5. 然后pip install 你刚下载的文件,发现就安装成功了


    image

Google浏览器的安装

百度软件中心下载

记得点普通下载(要不然有可能会收获百度全家桶一份)

下载完正常安装就行

安装可以更换浏览器头的插件

  1. 打开 google插件下载这个网页
  2. 在输入框内输入 extension ID ffhkkpnppgnfaobgihpdblnhmmbodake
  3. 点击下载


    image
  4. 下载完成后,打开Google浏览器,在地址栏输入chrome://extensions/
  5. 把刚刚下载的文件拖进去进行

最终效果就下图

image

总结

看完本篇文章后,你应该要

最后,因为后续实战我基本上都是用Jupyter notebook来写调试的,所以请阅读以下两篇文章,能大概了解Jupyter notebook

Jupyter Notebook快速入门(上)

Jupyter Notebook快速入门(下)

上一篇 下一篇

猜你喜欢

热点阅读