量化

Golang 爬虫 Colly 入门

2018-08-01  本文已影响12人  梅_梅

1. 概述

gocolly是用go实现的网络爬虫框架gocolly快速优雅,在单核上每秒可以发起1K以上请求;以回调函数的形式提供了一组接口,可以实现任意类型的爬虫;依赖goquery库可以像jquery一样选择web元素。

gocolly的官方网站是http://go-colly.org/,提供了详细的文档和示例代码。

2. 安装配置

安装

go get -u github.com/gocolly/colly/...

引入包

import "github.com/gocolly/colly"

3. 流程说明

3.1. 使用流程

使用流程主要是说明使用colly抓取数据前的准备工作

3.2 抓取流程

每次抓取数据流程中的各个节点都会尝试触发用户注册的抓取回调函数,以完成提取数据等需求, 抓取流程如下。

4. 辅助接口

colly也提供了部分辅助接口,协助完成数据抓取分析流程, 以下列举一部分主要的支持。

5. 实例

更多可以参考源码链接中的例子

上一篇 下一篇

猜你喜欢

热点阅读