机器学习与数据挖掘Dtalks大数据 爬虫Python AI Sql

【DTalk精华】网易郑栋:如何打通产品多端的埋点数据?

2018-04-24  本文已影响23人  叨叨侠爱叨叨

郑栋, 网易互联网分析产品、可视化 BI 产品负责人。多年从事大数据技术相关工作,目前在网易管理互联网分析、敏捷BI两个数据分析产品线,在大数据技术、互联网业务数据体系建设、团队管理方面有丰富的经验。 负责过网易旗下多个业务及产品的数据体系建设工作,也有应用分析、营销监测、用户行为分析、可视化分析等多个数据产品的实战落地经验。

这是个归因的问题,一般提到帐号打通,就会有归因的讨论 。

现在的分析产品在一般情况下,移动端会通过 SDK 生成唯一 ID 来标识用户/设备。移动化发展早期,很多采集工具用过 mac address、IDFA、android_id、IMEI 等从移动操作系统可以获取的设备软硬件信息来标识设备,但随着操作系统的发展,很多信息获取接口要么被封禁,要么已经失去了精准性。反倒是一开始就通过自己生成的 ID 来标识用户的工具,受到的影响不大,基本保持了用户/设备标识的稳定。

但这种方式有个问题,在用户卸载、重装或者刷机后,ID 信息会丢失,导致生成新的用户/设备 ID。

我们采用过 ID Mapping 的技术来做过 ID 的打通:对每个用户生成一个虚拟 ID,对同一个用户的多个设备和帐号进行映射,并绑定起来。

通过这个虚拟 ID 实质上就打通了产品的多端数据。ID Mapping 体系的建设工作量不小,Mapping 后用户标识如果需要发生调整,在基于事件的分析产品上需要对老数据进行重写,比较复杂。所以对于一些强帐号体系的产品,可以退化到只用用户帐号来做关联,只有非登录匿名用户才用设备 ID 来标识,这往往是性价比比较高的方案。

推广渠道归因就方便了。

支持营销效果评估的分析平台会要求产品在平台上生成推广链接进行投放。用户在点击链接时,会从分析平台的域下做跳转再到目标页,这样就可以借助浏览器的 cookie 机制进行匹配,来对用户来源进行归因,但这种方式在移动端上面的表现不太好(iOS 已经取消了 SFSafariViewController 多应用共享 cookie 的支持)。除此之外,也可以采用 ID Mapping 提到的近似匹配技术,很多厂商声称的设备指纹技术大多也是这种,不太准,但定性分析是可以的。

归因这块,一些推广渠道做了些工作,解决移动端不好溯源的问题:支持设备 ID 的回传功能来方便产品归因问题的解决。

产品方在投放链接的时候,遵照特定格式即可

比如

https://xxx.com/aaaafD?idfa=__IDFA__&imei=__IMEI__

渠道在用户点击广告链接后,会把设备 ID 如 IDFA 或 IMEI 加到链接的内容里面,用户激活后便可以通过相应 ID 匹配来归因。

原文首发于微信号——Dtalks
作者:郑栋——网易互联网分析产品、可视化 BI 产品负责人
文章可以转载, 但必须告知,并且以超链接形式标明文章原始出处和作者信息


干货专访和文章

【DTalk精华】网易郑栋:前端数据采集与分析的那些事第一弹: 从数据埋点到AB测试

【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第二弹:企业如何选择自动埋点和可视化埋点

【DTalk精华】滴滴出行谯洪敏:前端数据采集与分析的那些事第三弹:埋点需求整理原则于埋点流程规范

【DTalk专访】滴滴谯洪敏:百家争鸣的前端技术时代

【DTalk思考】顾青:互联网团队的数据驱动能力从哪里来?

上一篇 下一篇

猜你喜欢

热点阅读