美团机器学习实践

2019-12-08  本文已影响0人  天气不是很好啊

之前为了做房源标签,单独读过这本书的第五章,受益匪浅。

最近随手翻了下,发现其他章节的内容也干货十足,堪称机器学习的实践范本,索性一口气读完。

希望通过阅读,了解1.在美团的业务场景下,NLP/推荐/搜索落地的应用思路。 2.策略算法的思维框架

6.POI实体链接

美团的到店业务,是基于一个个POI实体展开的服务,如何保证POI实体的信息质量稳定、完整、优质,是保证业务流程性的基础核心点。

6.1 背景与难点

难点:

主要思路:

问题转化为,如何计算两个POI间的相似度;如何确定候选集范围。

6.2 国内酒店POI实体链接解决方案

如何计算两个POI间的相似度

step1

梳理所有和POI相关的信息维度。

国内酒店的所有POI信息
step 2

确认特征维度
从业务角度看,找寻一家酒店,不可或缺的信息是:
名称、地址、电话、经纬度

step 3

特征生成

通过分词、字符串相似、规则、正则匹配等方式,解析所需要的信息,生成特征。

6.3 其他场景的策略

景点POI链接:因为景点POI和酒店的特点不同,例如多个电话、地址写法混乱导致解析效果差等,需要调高POI名称的权重并且增大索引颗粒度。

7.评论挖掘

用户更倾向于看到或者听到同类用户的亲身体验以及自身反馈,例如购买过同类产品的用户的评价,对比使用过同类用户的亲身体验及自身反馈。

整体的挖掘可以分为三个步骤:

7.1 挖掘的粒度

对社交网络或者在线电商,评论描述仅针对单条信息或者单个商品,那么,对于商品粒度的评价体系进行挖掘,理应成为业界的关注焦点。

美团因业务不同,更关注对于POI的描述,及关注对酒店的描述大于对酒店一类房型的描述。

因此,最终评论颗粒度定位在POI粒度。

7.1.2 评论挖掘的维度

在明确了评论挖掘的颗粒度后,我们需要对评论挖掘的维度进行阐述,也就是通常所说的标签维度。
同样称为标签,评论挖掘的中的标签与用户画像中的标签却有很多不同之处。最明显的差异在于,用户画像中的标签是对C端用户进行属性挖掘和行为构建,而评论挖掘中的标签则是对B端商家进行硬件侧面的挖掘和服务层面的判定。

酒店评论挖掘中的标签维度简图
7.1.3 评论挖掘的整合思考

7.2 评论标签的提取

10.推荐在O2O场景中的应用

10.2 O2O推荐场景的特点

以美团移动端推荐为例,O2O推荐场景与其他推荐的区别具体包括如下三点:

10.3 美团推荐系统框架图

推荐系统框架图

10.4 美团推荐实践-推荐召回

上一篇 下一篇

猜你喜欢

热点阅读