数据科学与R语言R语言小技能

虚假流量识别

2019-01-02  本文已影响3人  Liam_ml

广告投放环节

由于广告投放过程中服务方存在各级代理,存在流量获取的透明度不高的问题,可供作弊的灰色区域越来越多。


image.png

虚假流量的发生机制与获利方式

  1. 机器作弊+人为作弊

目前较好的预防措施,是通过基础的用户行为分析来识别此类虚假流量,在通过补量,屏蔽的方法来减少虚假流量。例如:频繁跟换用户身份,大量使用同一个cookie,一个用户有成千上万的展示

人为作弊,可以深入分析用户的行为,比如转化情况

虚假流量的获益形式

围绕不同的付费形式,思考不同的作弊场景

虚假流量的生态圈

  1. 虚假流量的提供者:媒体与广告平台的利益捆绑
    广告平台和媒体是虚假流量的提供者,两者掌握着大量的流量资源。
  1. 虚假流量的获取者:“KPI”压力下的无奈与默许
    在一定程度上,广告主很容易成为虚假流量的“推动者”,例如在以下场景中:
  1. 高利润、低风险助长双方流量作弊
    虚假流量并无高深的技术含量,且流量造假成本极低。相关数据显示:刷流量的成本不及正常流量成本的十分之一。

识别虚假流量

识别虚假流量的难点
为识别虚假流量,广告主会因以下两个问题而犯难:

  1. 广告投放数据与网页转化数据断层,无法判断后续转化情况

什么是广告媒体数据?

什么是转化数据?

  1. 无法判断虚假流量渠道,并进行规避
    无论是哪种转化行为(注册、呼起、下载、激活等)都离不开流量渠道,更多时候转化行为是由多个流量渠道共同承担的。

五、全流程数据流量监控是识别的基础

image.png

识别虚假流量的常见纬度

  1. 基本属性:具体包括:时间 & 地域维度、终端类型、操作系统、联网方式、运营商、IP 集中等
  1. 产品参与度:具体包括:跳出率、平均访问深度、平均访问时长、用户行为路径、页面点击情况、流量留存情况、单页面人均访问次数等。
  1. 转化情况

总结

基本判断

  1. 时间维度,将时间细化到小时,看时间的一个分布

  2. 用户的访问设备分布

  3. ip的集中程度
    一般而言,某一个ip频繁点击,流量激增都是不正常

产品参与度深度判定

  1. 跳出率
  2. 看平均访问深度
  3. 看平均访问时长
  4. 看转化
上一篇下一篇

猜你喜欢

热点阅读