产品应用—数据

2020-02-21  本文已影响0人  夜夛

大数据:使用大量的数据分析和预测用户行为,这个过程我们称为大数据。大数据的基础是数据本身,也就是说必须先积累足够大的数据样本,然后基于这些数据进行分析,从而产生有价值的数据分析结果。

用户使用产品时,会产生大量的数据,如果是内容型产品,产生的就是内容数据,例如文字、视频或者音频。如果是交易平台型产品,产生的就是用户行为数据和叫用户行为数据和交易数据,根据不同的数据类型,可以进行大样本的数据分析,数据分析结果可以转化为商业决策的依据,从而反向产生更大的商业价值。

1.数据分类及数据分析

结构化数据就是按照固定的格式和结构存储的数据,好比按照格子一个个的存放数据;非结构化数据对一些零散型数据的集中管理,好比在一个格子里放上很多零散的东西。通过分析结构化数据可以预测数据走势,提前预判风险,通过分析非结构化数据可以进行一些行为分析和相关推荐。

2.结构化数据

结构化数据是按照一定的数据规则和结构存储的数据。例如:电商产品里的结构化商品数据,这些商品数据按照严格的商品分类和商品属性进行分类存储。按照这种结构存储的数据可以被有效地进行分类管理,基于这种结构化的存储形式,我们可以按照某一维度对数据进行分析和处理。

例子:在医疗产品里,很多检查报告都是以拍照传图的方式进行数据存储的,这些检查报告里由大量的关键数据可以作为后期患者病例大数据分析的原始素材,但是如果这些数据是以图片的方式存储的,就很难对里面的关键数据进行提取和分析,所以好的做法是抽取关键数据以结构化的方式进行设计并存储,让用户进行关键数据的填写并以图片为附件,虽然使用户在操作上多了一步,但是数据的价值在后期会被发挥出来,这也是结构化数据带来的好处。

3.非结构化数据

非结构化数据大多数是一些零散的、没有一定规律的数据。比如:用户在电商网站上浏览商品的浏览记录数据,或者一些系统的操作日志。这些不是按照一定规则进行结构化存储的数据都叫作非结构化数据。例如图片、视频、音频等数据都属于非结构化数据。与结构化数据相比,非结构化数据的采集和分析更复杂,非结构化数据的数据量也要大很多。

例子:某个用户的浏览记录通常都是覆盖在经济管理图书和鞋类商品上的,通过对这些浏览数据的分析,我们可以判断出这个用户的使用行为,基于这个行为结论,可以向这个用户推送经济管理类的书籍和鞋类商品,以此提高用户对产品内容的关注度和成交率。

4.数据指标

数据指标是指产品在各个方面所记录和统计出来的数据结果。是对过去进行回顾和对未来进行预测的参考标准。在产品方面,通过一些数据指标,可以观察和判断产品的健康程度。基于这些数据指标进行分析,可以得出很多指导性的建议和下一步的调整方案。

4.1 UV/PV

UV(Unique View)是网站独立访客和独立用户的意思,指访问某个网站的独立IP数量,通常计算的周期是当天的0-24点。UV可以反映出用户活跃度,也可以反映出在某一个固定周期内用户使用产品的情况。在同一天周期内,同一个IP无论访问多少次产品,UV都计算为1。IP地址是固定的,一个用户,对于产品来说,只有一个IP。

PV(Page View)统计的是用户打开网站的次数,是指某一个功能或页面被用户访问多少次。重复访问的次数也计算在内。通过PV指标可以进行一些分类测试(A/B测试)

4.2 DAU/MAU

DAU是指日活跃用户,记录一天内,独立用户登录或使用产品的次数。

MAU是指月活跃用户,记录一月内,独立用户登录或使用产品的次数。

通过DAU和MAU的数据统计,可以持续观察产品的运营情况,可以针对数据指标结果做一些对产品方面的调整与优化,每天跟进产品数据是了解产品健康度的重要手段。

4.3 GMV

GMV:商品交易总额,反映平台交易总量的数据指标。

4.4 转换率/留存率

转化率是统计一个大范围的运营活动或者产品动作转化出有效用户的比例。

留存率是指用户进入产品后,在一定的周期过后留存在产品中的用户比例。

5.数据仓库-DW

数据仓库(Data Warehouse)简称DW,是一种对历史数据进行存储和分析的数据系统,通常是为企业根据过往数据进行分析从而制定相关决策而存在的。

数据仓库的数据来源通常是历史业务数据,例如历史订单及客户信息等,还包括一些系统的操作日志记录等。这些数据统一汇总存储至企业数据仓库。

企业数据仓库示意图

数据仓库不同于数据库,数据库是对实时数据进行存储和事务性处理的系统,对应的操作包括了对数据的增删改查。而数据仓库通常只对数据进行查询操作。数据库是为捕获数据而生,数据仓库是为了分析数据而生。

例子:在电商业务中,如果我们要分析过去一个月内三星手机的销量和地域分布,就可以从数据仓库中组合“三星手机”、“时间维度”、“地域维度”这三个查询指标,通过组合数据导出数据查询结果并形成报表,决策者可以根据数据仓库生成的数据报表进行下一步决策。数据仓库的数据来源都是从业务数据库导出的,每天业务数据库都会产生大量的生产数据,定期将这些数据导入数据仓库,可以为后续进行历史数据查询分析并制作目的数据报表提供数据来源。

可以按照不同的维度进行组合数据查询和分析时,就是通过数据仓库完成的。数据仓库是数据的集中处理和分析仓库,为业务和产品决策提供数据支持。

7.5 数据可视化

数据可视化是指通过不同的视觉呈现方式,将数字数据通过生动形象的方式展现出来,使得数据查看者能以一种更直观的方式查看数据。数据可视化是对数据分析结果的展示,通过数据可视化能够给决策者提供更直观生动的数据决策支持。

7.6 数据驱动下的产品和业务

数据是最能反映产品和业务结果的指标,产品上线后往往能收集到很多数据,通过这些数据进行进一步分析和验证,可以得出一些验证结论,基于这些结论指导产品的优化和业务的调整,可以不断提升产品价值和用户体验。

在产品上线后,进入产品运营阶段,运营是通过人工干预来提升产品的各项数据指标。如果通过数据去监控整个过程并根据数据分结果优化产品方案,则首先需要完成的是定义数据指标。针对一些产品转化事件,可以设置漏斗模型,例如,假设要统计两个不同的产品功能入口最终转化的用户下单成交的概率,就可以分别针对两个产品入口进行路径统计,看通过哪个入口最终完成的用户成交率高,通过结果分析来进行下一步的产品调整,重点优化转换率高的路径。另外从最优路径里还可以向下统计各个环节的向下转换率。

购物转换漏斗模型

每一个环节和路径的设计都会影响最终的成单转换率。收集数据并对结果进行分析得出最终结论,通过数据观察和分析可以得出哪种设计下的漏斗转换率更高。

总结:

数据按类别分为结构化数据(按照一定的数据规则进行存储的数据)与非结构化数据(没有固定规则、零散型的数据)。大数据通常以前者居多,结构化数据可以按照不同的维度对产品或业务进行分析并得出结果。非结构化数据(浏览记录、操作日志等)适用于分析用户行为及日常推荐。

数据指标:统计和反映产品在各个方面的健康程度。

UV:每天独立IP访问的数量。PV:某一个功能或页面在一天内被访问的次数。(根据PV指标,进行A/B测试,可以得出哪个页面点击次数更高)

DAU:日活跃用户数         MAU:月活跃用户数      GMV:商品交易总额

数据仓库:不同于数据库,数据仓库多是进行查询操作。数据仓库的数据来源于业务数据库中的生产数据。定期将业务数据库中的生产数据导入到数据仓库中,可以为以后进行历史数据查询分析并制作目的报表提供数据来源。为决策者提供数据支持。

数据可视化:将数字数据以更加生动形象的方式展示,以便数据查看者能够以更直观的方式查看结果。数据可视化是反映产品和业务整体情况最直观的方式。

数据驱动产品:通过对产品各类数据的收集和分析,可以对产品或业务的下一步进行调整与优化,利用数据驱动产品。

A/B测试:同时在市场上发布A方案和B方案的产品,通过观察两种方案下的数据指标(转化率或者活跃度)可以得出哪种方案,基于数据结果选择最优方案。

上一篇 下一篇

猜你喜欢

热点阅读