广告系统如何识别用户?

2016-06-27  本文已影响890人  Jogging

2016-06-26 蒋 华 广告部

什么是互联网中的用户识别?

用户识别概念人们应该并不陌生,现代社会中每个公民都有唯一的永久的身份识别编码,在中国我们称为身份证号,这个唯一的公民识别号在很大程度上是不会发生变化,伴随人的一生,公民在社会中的很多行为都会通过这个号码识别出来,例如在银行、医疗机构、学校和电信等公共部门办理事务的行为都会通过这个号码记录下来,政府或机构可以追踪一个人的资金往来、教育经历、医疗情况和通信内容等,我们可以想象这个唯一身份号码在现代社会中的重要作用,但是也存在很多弊端,最主要就是滥用和泄漏公民信息带来侵犯公民隐私的问题。

那么在互联网中,是否存在或者需要类似的网民识别系统?答案是不言而喻的,同样存在一套商业上的用户识别系统,普通大众网民在浏览新闻、看视频、淘宝(购物)、玩微信和QQ时候,用户识别在底层默默的发挥作用,用户并不会感知这一切的存在,企业建立这个系统更多的是出于商业考量建立的,而非是获取用户隐私信息。互联网企业为用户提供信息检索、购物、新闻聚合和社交网络服务等,通过用户识别系统,唯一标识收集到用户的访问行为和信息,企业可以根据用户的这些对用户进行偏好分析和精准推荐,例如用户在汽车之家应用上浏览汽车评测和新闻信息,后端的智能系统通过计算用户历史浏览记录为用户即将的访问提供精准的推荐,用户能够更快的找到自己近期关注的热点车型和车系,将用户与汽车厂商在平台上进行精准的连接,在这个过程中企业和用户是一个win-win(双赢的)关系。

用户识别在商业广告投放中的应用?

上面介绍用户识别在用户偏好分析和精准推荐上的重要性,只有在建立行之有效的用户识别系统基础上,才能建立准确的、完整的、多维度的和长期的用户信息收集,如果没有为每个用户分配唯一的识别号,就会发生“张冠李戴”的事情,更不要谈后面为用户建立用户画像、标签体系和特征集。

在推荐系统中,为用户推荐广告与传统的内容和商品推荐本质上没有区别。汽车之家广告系统能够收集三端(PC端、M端和APP端)用户访问行为,为每个用户建立唯一标识,实现跨屏识别,即用户不管切换到哪个设备,广告主也知道是同一个人,从而实现跨屏定向投放和广告投放频次控制。

如何实现用户跨屏识别?针对跨屏识别及跨屏追踪用户,目前有两种方法:

  1. 精确识别法

此种方法依赖于网站的强账号体系或个人身份 ID 进行识别,例如用户以同一网站账号在多个设备上登陆,将在此账号下的行为归结到唯一用户标识,这种标识是最准确的和有效的,只要用户跨屏登陆设备,广告主和媒体可以使用唯一标识在多个屏幕上精确定向到这些用户。这个方法的有效性取决于大规模、跨屏的用户覆盖。

  1. 概率识别法

此方法是基于设备类型、Cookie、IMEI、IDFA、MAC地址、操作系统、IP、地理位置数据、时间序列数据和许多其他的用户访问特征数据,使用算法分析匹配来实现。例如我们从数据分析看用户在PC端和手机上访问网站的行为规律、访问地点和网络信息等,推断这两个设备属于同一个人的可能性有多大,达到某一个可接受的阈值,将这两个设备识别为同一个用户。显而易见,这种方法需要大数据技术和机器学习的支持。概率识别方法,通常先以精确识别法建立的用户标识做为种子样本,利用算法去学习哪些特征具有较强识别性,建立模型识别用户,从而提升准确度。使用此种方法的关键是大量准确的用户数据,通常其匹配准确度达到 70% – 90%。

目前行业困境?

上面提到跨屏用户识别的主要依赖精确识别法的种子用户,通过概率识别方法推广到更多的用户,但目前行业内仍然要面对许多挑战:

  1. 特征数据辨识度不理想

在概率识别模型中,由于国内 IP 资源贫乏,中国网民人均 IP 持有量为 0.5 IP,而在美国互联网中,人均 IP 达到 4.5,在此种情况下,同样的算法,如果使用 IP 做为特征,模型预测准确的可能会有很大差距。

另一方面是国内使用Android系统的山寨机、安全助手和广告屏蔽插件造成MAC地址、IMEI和Cookie等信息混乱,导致使用这些特征训练的概率模型的预测准确度下降,最终影响整个网站的 ID(标识)不稳定,发生 ID 冲突和漂移,可以理解为“张冠李戴”现象。

2.企业壁垒和数据孤岛

屏幕快照 2016-07-13 上午11.22.18.png

若采用算法做概率识别,数据量级及覆盖就会极为关键,如能获取用户在不同企业应用上的行为和用户标识,就能建立全网的跨屏用户识别体系,获得用户在不同领域的核心特征,能够绘制更全面的用户画像,这些都要依赖于成熟的、公平的和开放的数据交换平台,但目前国内,真正具有数据价值的 Exchange的开放程度与数据支持粒度极为有限,基于用户隐私的考虑,BAT类企业不会把自有的精确数据对外开放。

数据交易平台

目前可以看到的解决各企业数据孤岛问题,是建立一个完善的数据交易体系,对于手里掌握大量互联网用户网上行为数据的企业,不可能免费的将用户数据提供其他公司。

在现阶段数据交易的过程其实在广告程序化交易市场已经存在,广告主通过DSP代理进行广告投放,各DSP平台通过Ad Exchange(广告交易平台,包括百度(BES)、腾讯(广点通)和阿里(Tanx)等)或者媒体,参与到广告竞价过程中,ADX在此过程中会将他们所识别的用户标签发送给DSP平台,虽然ADX在竞价过程为DSP提供的服务,结果是提升投放效果,获得更高的盈利空间。DSP在这个过程中获得了各ADX平台的用户标签数据。这是目前比较成熟的数据交易商业模式,做为广告程序化交易过程的副产品存在。

从目前ADX发展来看,未来数据交易平台(DATA Exchange)拥有哪些特性:
1、比ADX更具独立性,但还是掌握在几大流量平台
2、实施统一的数据标准和规范
3、能够解决用户和企业数据隐私问题,数据脱敏
4、能够评估数据价值,同一份数据针对不同数据需求方的价值可能是不同的

上一篇 下一篇

猜你喜欢

热点阅读