08. 如何自动化采集数据

2019-02-09  本文已影响0人  进击的原点

数据源

image.png

一个数据的走势,是由多个维度影响的,要通过多源的数据采集,手机尽可能多的数据维度,同时保证数据的质量

开放数据源

行业的数据库

爬虫抓取 - py、常用工具

网站,App

传感器

物理信息,图像、视频、速度、热度、压强等,基于特定设备

日志采集

统计用户的操作,在前端进行埋点,在后端进行脚本收集、统计,分析网站访问情况及使用承载瓶颈等。是运维人员重要工作之一。
记录了用户访问网站的全过程,那些人在什么时间通过什么渠道来过,执行了哪些操作,系统是否产生了错误,IP、HTTP 请求的时间,用户代理等0​

上一篇下一篇

猜你喜欢

热点阅读