python网络爬虫

2019-05-04  本文已影响0人  suntwo

title: 网络爬虫实战
date: 2019-03-18 19:28:29
tags:


  1. 介绍

    ​ 使用python来编写爬虫简单高效,即使新手也能够很容易的学习,接下来我将要面向新手讲解爬虫的整个过程,接下来讲解python环境的搭建。

  2. 环境的搭建

    • 第一步安装python环境,直接在官网下载即可,网上有很多的python安装教程,照着一步一步的安装即可。
    • 第二步检测python是否安装成功,打开windows的命令行模式,输入python来检测python是否安装成功,如果进入交互界面表示安装成功。
    • 第三步导入我们需要的一些第三方模块,使用命令pip install requests和pip install bs4,开导入requests和bs4模块
    • 第四步再次进入交互界面输入import requests和from bs4 import BeautifulSoup来检测导入第三方模块是否成功。

    如果你成功完成了上面的四步,那么我们的编写爬虫的环境就搭建成功了,接下来便是我们的重点,来开始我们的爬虫项目了。

  3. 开始我们爬虫的第一个项目

    ​ 我们是不是经常在网上看到一些电影排行榜或者音乐排行榜哪,有的时候我们想要将这些好的电影或者音乐的名字,作者或者上映日期等信息记录下来啊!如果数目少的话我们或许可以找个记事本记录下来,但是当拥有成百上千条记录的话使用人力记录下来是很困难的,因此这便显示出我们爬虫的魅力了,接下来我将使用爬虫来爬取一些数据。

    爬取得目标:http://www.9ku.com/qingyinyue/paihang.htm这是一个轻音乐旁行榜的网址我们接下来便是对这个网站上的轻音乐进行爬取。

上一篇下一篇

猜你喜欢

热点阅读