电商大促GMV和支付规模预测

2019-03-11 本文已影响73人书生婉悠

在电商大促时，为了能够合理地制定KPI、高效地商品备货和营销资源的安排，都通常都需要对这次大促的GMV和订单规模做预测，避免出现诸如产品断货或者过剩、人员效率不高等问题，导致客户流失未能成交。

本篇文章，就简单地说一说在做大促预测时候常用的一般方法和逻辑。这里需要说明的时候，预测是允许存在一定误差的，我们无法要求实现百分百的准确，但是至少，需要做到和最终结果在数量级上是一致的。

这里很明确的，我们就是要预测某个大促时间段的GMV，做本次预测的核心目标是，让业务方做好对促销资源投入的评估，最终实现投入资源的合理分配。

在传统的预测中，通常是基于历史GMV趋势做预测的，衡量的是历史大促期相对平销期流失爆发度，计算公式是本次大促GMV=大促前平销期GMV*大促爆发系数，其中，大促前平销期GMV可以通过时间序列模拟获得，而大促期间的爆发系数通常是基于业务经验做推断获得的。

但是通过这种方法发现，最终结果的不可控因素非常多，比如业务经验是否足够，时间序列周期的选择和模型的选择，最重要的是，这种预测放大是无法识别出不同用户的购买意向，也就做到之前的核心目标，不便于优化投入的资源分配和细化策略。

这里选择的是按照用户拆分，来预测用户支付概率和金额，具体如下图所示：

通过上面的拆解，就把预测趋势的问题转换为分类问题，探索的是客户是否购买，以及购买的金额的问题，这样在基于电商丰富的数据，是能够将预测结果控制在合理的范围内。

这样，预测的输出结果就明确了，首先是用户id，用于用户的分类，例如基于此，可以将用户分为A组、B组等；其次是不同分类用户的购买概率，例如A类、B类客户购买概率分布是多少；最后是大促的购买金额。

接下来，为了得到最终的结果，需要确定模型和对应的特征工程。这里，特征工程的选择必须尽量丰富，例如可以包括年龄、性别、优惠敏感度、近14天访问次数、近14天加购次数、近30天是否支付以及会员等级等。针对模型选择方面，这里可以使用的模型还是很多，需要尽可能的实验尝试，比较经常用到的是GDBT模型和LR模型，但是需要明确不同的适用场景。

确定了目标、特征和模型后，接下来就需要收集用到的数据，比如日志、数据库等；同事需要对收集到的数据做好清洗，例如异常值、缺失值处理，数值类型转化、不同量纲数据的标准化等。

接下来还需要针对模型预测的结构做分析和检验，主要用到的是离线测试数据集检验和线上数据实测对比，需要综合评估准确率和召回率两个指标。

经过了以上几个步骤，基本上就可以得到想要的结果了：用户分类，不同分类用户的购买概率和购买金额。

我的营销生财知识星球是定位于做数据和营销相结合的内容，希望通过数据分析帮做做好营销和运营的工作，经过一段时间运营，我的小密圈也将近300位小伙伴了，接下来的一年里，我都认真尽心的把这个圈子运营好，产生更多的优质的内容。

下面是小密圈中已有的或者将要有的内容，对于将要有的内容我都会在未来的一年中一一实现到，做好优质的内容生产：

电商大促GMV和支付规模预测

猜你喜欢

热点阅读