你男/女朋友为何都不如一App懂你
科普一个大家(这里的大家指的是小白)可能会比较好奇的东西~
有没有感觉现在各大公司的推荐给你的内容或者产品命中率越来越高,这种App都比你男朋友更懂你的感觉是不是贼尴尬。“你都不如一APP” 这其实是有原因的。
首先群体的智慧是伟大的。
1、为什么感觉App知道你喜欢什么,想买什么。
虽然你不愿意承认,但是现实中就是会存在一些跟你爱好、年龄、品味等等相同的人,有的几乎是完全一致。当一个App具有一定规模的用户量之后,就可以轻易的用一些方式对用户进行分类了,比如说常见的用户画像策略,基础用户分类及相似性分析,根据你在App或者社交平台的一系列阅读购买等行为的来推测你的倾向和喜好,然后再做用户相似性分析。这时候 App的运营者就会归纳出很多跟你行为特征、喜好、倾向 相似的用户,然后当这些用户购买或者阅读了你没阅读或刚买的产品时,就会把这些产品推荐给你。通常来说,那些“你”喜欢的东西,你也会喜欢的。
这就是最经典的UserCF,基于用户相似性完成的推荐策略。
2、是什么让你迫不得已、不断下单。
当然啦,有用户的相似,也就还有商品的相似。这里的商品指的不是商品的基础属性类似。而是说,用户A购买了商品x之后,紧接着购买了y,z等相关产品,这时候若存在非常多的类似行为,则会把x,y,z归纳为“相似产品”,所以也就产生了,你买了一双鞋,然后App贱贱的推荐了一条很搭的裤子,然后又推荐一个很搭的上衣,紧接着是包包,然后是口红,只要公司够大胆敢买很搭的汽车都是能给推荐到的。
这就是所谓的基于ItemCF,基于项相似性的推荐策略。
3、不小心单循了一首歌,然后第二天推荐歌单就疯了。怎么治改它?
有时候,我们看新闻时或者听歌时,“不小心”看了几个相同内容相似、类型相同的文章或者歌。然后第二天的推荐就开始找不到北了,疯狂的拿这样的内容炸你的手机。别慌,这其实就是App太敏感了,因为有一种机制叫做基于内容的推荐方式,他会根据你点击或者阅读的频次,来判断你对一个新事物的喜好程度,来开发你的内心真正的倾向。惊讶不,现在App就是如此的智能了,如果你不想让他这么试探你,不想让他这么懂你,或者他猜错了,你紧紧是不小心的尝试。
别慌,这时候你阅读或者单循自己已经喜欢的类型的内容时,作用通常是不是非常大的。你可以搜索一两首自己许久没听没看的内容,然后单循几次,多点开几次。避开刚才不必要的麻烦,然后隔段时间重复几次,让App知道,你刚才是点错了,对刚才的内容根本没兴趣就够啦。同时,这种策略也能解决,推荐某一主题推疯了的App。
背后具体是按照内容属性进行匹配,必要时进行分词、歌曲情感匹配,来达到你想要的同类型内容,这差不多是最基础的基于内容推荐
4、偶尔来点新口味,但也知道我最喜欢什么,比男朋友靠谱多了。
如果有这种感受了,恭喜你,你已经成为这个App忠实的用户了,已经几乎被捕获了。你可能会爱他甚于你男票or女票,不为别的就冲他懂你。
这背后的支撑体系较为复杂,这个App已经掌握了你大部分的基础信息,知道了你的倾向&喜好,拥有你曾经的操作,知道你的社交圈,熟知你的职业、年龄、已婚、未婚、单身与否、什么爱好,已经为你建立了一个与内容&产品的关系对应方式,这是你不断的培养的成果,你和大家不断的行为,让App已经逐渐看清了这个用户群,知道其中的关系,甚至了解你的心情和近况,更可怕的是它能推测你自己都不知道的自己的隐含倾向,一种 X -> Y 的能力。这背后存在一个你和大家一块养成的模型,通常的使用的技术大家可以通俗点理解为人工智能。
5、感觉自己总是能发现最新鲜的事儿,感觉信息获取率第一。
小姐姐们,小哥哥们,这种时候不要太过惊讶。当发现跟别人说的时候,大家好像也看过的时候,也不要悲伤。其实背后就是一个热点推荐,一个偏好口味的热点统计策略。热点会有很多,你感兴趣的也会有很多。当这些内容出现交集时,好啦,等着发现猛料吧。我猜,半年前鹿晗粉丝应该是第一时间被告知或知道鹿晗恋爱的,现在想想这策略有时候有点狠啊。除此之外,除去出现匹配时,App也是会给你不定时随机发一些热点,大家跟风效果比较好,通常会点的,同时也能作为App挖掘你喜好的一种方式,他何乐而不为呢。
6、不同了解你的方式,不同的暖。有没有想象过把它们混在一起呢,你男/女朋友还能比嘛?
通常我们会发现现实中App是这些方式都会具有,但是不同类型的App侧重点不同而已,这其实就是一种混合推荐策略。
这些背后支撑的,都是你在一个App上的数据和App自身的机制,其中包括基础数据、历史行为信息、当前行为信息 再加上一点优秀的算法(数据处理策略),然后就这么被 App捕获了,别慌,以后会捕获的更轻松的。有没有感觉全是自己跟自己的小伙伴大家一块儿挖的坑~
结论:
什么都需要培养,一个App或者模型需要,你的对象更需要,相互多深入了解,多交流,事情就变得不同了。祝同学们新的学期开开心心,顺顺利利~
来点正式的简述:
随着互联网时代的到来,互联网用户量激增、用户行为日渐活跃及复杂,其过程中产生的数据量爆炸式增长,为企业掌握用户倾向、完善推荐策略提供了机遇也带来了挑战。面对如此大规模的数据,我们有机会多个维度及角度更加全面的分析用户倾向、喜好,但在如何完善现有的推荐策略,如何构建一个高效的推荐系统成为亟待解决的问题。
相关知识:
【协同过滤算法】【余弦相似性】【欧几里德距离】【ALS】【矩阵分解】【SVDFeature】【分词算法】【明可夫斯基距离】【Jaccard Similarity】【皮尔森相关系数】等相关知识(仅列举部分关键词,有兴趣自行百度,其他的会推荐给你的)