数据分析

【A/B测试】支付平台营销策略效果分析

2020-12-16  本文已影响0人  分类讨论

内容概览:


A/B测试

A/B Test简介:

简单的说,A/B测试是在同一时间段内,给多组特征相同的用户展示优化前(对照组)与优化后(实验组)的产品,通过实验组和对照组关键指标的数据分析,验证一个新的产品的交互设计,产品功能或策略,算法的效果,得出效果是否复合预期的结论。A/B测试可以科学的检验变更的好坏,是精细化运营的必备手段

A/B测试的流程

A/B测试的流程

显著性假设检验

案例:支付宝营销策略效果分析

1. 背景:

广告收入与平台佣金是支付宝收益的重要渠道之一,提升支付宝广告的点击率不但可以获取广告费用,同时对服务产品的付费率也有很大的帮助。为了进一步提高广告的点击率,平台设计了两种营销策略进行A/B测试,通过对测试结果显著性假设检验分析确定营销策略的使用。

2. 实验目的:

分析营销策略一与策略二能否实现广告点击率提升一倍。

3. 数据来源

数据来自阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=50893

4. 数据分析

import pandas as pd
import numpy as np
import matplotlib as plt
4.1 数据导入:
# 导入数据,并设置表头
data = pd.read_csv('audience_expansion/effect_tb.csv',header = None)
data.columns = ['dt','user_id','label','dmp_id']
data = data[['user_id','label','dmp_id']]
data.head()
4.2 数据清洗
# 查看数据
data.info()
data.describe()

数据类型无需处理

user_id,label,dmp_id三列数据均相同,无空值

# 查看是否有重复值
data[data.duplicated(keep = False)].shape

有25966条重复信息

# 删除重复值,保留第一个值
data = data.drop_duplicates(keep = 'first')
4.3 假设检验

1. 确定样本所需容量
通过当前的广告点击率,目标广告点击率,显著性水平确定样本所需容量

# 当前广告点击率:
round(data[data['dmp_id'] == 1]['label'].mean(),3)
# 目标广告点击率
round(2 * data[data['dmp_id'] == 1]['label'].mean(),3)

当前广告点击率为:0.013,目标广告点击率为:0.025,显著性水平设定为0.05
经计算,各样本容量至少应为1400
各组样本空间为

data['dmp_id'].value_counts()
各组样本空间均大于最少样本容量
2. 各组广告点击率
# 当前广告点击率:
data[data['dmp_id'] == 1]['label'].mean()
# 策略一对照组广告点击率
data[data['dmp_id'] == 2]['label'].mean()
# 策略二对照组广告点击率
data[data['dmp_id'] == 3]['label'].mean()

当前广告点击率为:0.0126
策略一对照组广告点击率为:0.0153
策略二对照组广告点击率为:0.0262
目标广告点击率为:0.025
显然策略一未达到目标点击率,目标而达到目标点击率
通过显著性假设检验,查看策略二是否显著
3. 提出零假设与备择假设
零假设 H0:P1 >= P2
备择假设 H1:P1 < P2
4. 构造检验统计量

# 用户数
# 对照组样本量
n_p1 = len(data[data['dmp_id'] == 1])
# 策略二样本量
n_p2 = len(data[data['dmp_id'] == 3])
# 点击数
# 对照组点击数
label_p1 = len(data[(data['dmp_id'] == 1) & (data['label'] == 1)])
# 策略二点击数
label_p2 = len(data[(data['dmp_id'] == 3) & (data['label'] == 1)])
# 点击率
# 对照组点击率
rate_p1 = label_p1 / n_p1
# 策略二用户数
rate_p2 = label_p2 / n_p2
# 合并点击率:总点击数/总用户数
rate_p1p2 = (label_p1 + label_p2) / (n_p1 + n_p2)
# 检验统计量
z_p1p2 = (rate_p1 - rate_p2)/np.sqrt(rate_p1p2*(1 - rate_p1p2)*(1/n_p1 + 1/n_p2))
z_p1p2

当零假设 H0:P1 >= P2为真时,检验统计量为-59.44
5. 确定分位点
单侧检验,显著性水平取0.05,通过Z检验查表得起分为点为:1.6448536
6. 检验统计量确认
根据备择假设值,为左侧检验,有正态分布的对称性可知,分为点为:-1.6448536
当检验统计量 < 分为点时,为拒绝域,反之为接受域
显然-59.45 < -1.6448536,拒绝假设H0,备择假设P1 < P2成立

5. 结论:

综上所述,两种营销策略中,策略一为达到实验目标,策略二达到实验目标。通过对策略二显著性假设检验,策略二对广告点击率有显著提升效果,因而在两组营销策略中应选择第二组进行推广。

上一篇 下一篇

猜你喜欢

热点阅读