商品实时推荐系统

2020-01-16  本文已影响0人  达微

链接:https://gitee.com/zhang_jun_xin/flink-recommandSystem-demo

商品实时推荐系统

1. 系统架构 v2.0

2.推荐引擎逻辑说明

image

​ 根据用户特征,重新排序热度榜,之后根据两种推荐算法计算得到的产品相关度评分,为每个热度榜中的产品推荐几个关联的产品

相似度 A B C
A 1 0.7 0.2
B 0.7 1 0.6
C 0.2 0.6 1

3. 前台推荐页面

​ 当前推荐结果分为3列,分别是热度榜推荐,协同过滤推荐和产品画像推荐

[图片上传失败...(image-8a047b-1578644363136)]

4. 后台数据大屏

在后台上显示推荐系统的实时数据,数据来自其他Flink计算模块的结果.目前包含热度榜和1小时日志接入量两个指标. 真实数据位置在resource/database.sql

image

5. 部署说明

以下的部署均使用Docker,对于搭建一套复杂的系统,使用docker来部署各种服务中间件再合适不过了。这里有一套简单的Docker入门系列

system

需要的服务有:Mysql、Redis、Hbase和Kafka

Mysql

<pre style="box-sizing: border-box; overflow: auto; font-family: SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13.6px; margin-top: 0px; margin-bottom: 0px; overflow-wrap: normal; padding: 16px; line-height: 1.45; background-color: rgb(246, 248, 250); border-radius: 3px; word-break: normal; tab-size: 4; color: rgb(51, 51, 51);">docker pull mysql:5.7

docker run --name local-mysql -p 3308:3306 -e MYSQL_ROOT_PASSWORD=123456 -d mysql:5.7</pre>

简单介绍一下命令,先拉取镜像,然后指定参数启动容器

Redis

<pre style="box-sizing: border-box; overflow: auto; font-family: SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13.6px; margin-top: 0px; margin-bottom: 0px; overflow-wrap: normal; padding: 16px; line-height: 1.45; background-color: rgb(246, 248, 250); border-radius: 3px; word-break: normal; tab-size: 4; color: rgb(51, 51, 51);">$ docker run --name local-redis -p 6379:6379 -d redis</pre>

Hbase

<pre style="box-sizing: border-box; overflow: auto; font-family: SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13.6px; margin-top: 0px; margin-bottom: 0px; overflow-wrap: normal; padding: 16px; line-height: 1.45; background-color: rgb(246, 248, 250); border-radius: 3px; word-break: normal; tab-size: 4; color: rgb(51, 51, 51);">docker pull harisekhon/hbase

docker run -d -h base-server
-p 2181:2181
-p 8080:8080
-p 8085:8085
-p 9090:9090
-p 9000:9000
-p 9095:9095
-p 16000:16000
-p 16010:16010
-p 16201:16201
-p 16301:16301
-p 16020:16020
--name hbase
harisekhon/hbase
</pre>

Hbase用到的端口,可以参考一下详细教程 启动成功之后我们可以访问http://localhost:16010/master-status登录Web界面

:point_right:

快速实现SpringBoot集成Hbase

Kafka

考虑到更好的区别这些端口,我这里启动了一个虚拟机,在虚拟机中在用dokcer安装Kafka,过程如下

<pre style="box-sizing: border-box; overflow: auto; font-family: SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13.6px; margin-top: 0px; margin-bottom: 0px; overflow-wrap: normal; padding: 16px; line-height: 1.45; background-color: rgb(246, 248, 250); border-radius: 3px; word-break: normal; tab-size: 4; color: rgb(51, 51, 51);">## pull images
docker pull wurstmeister/zookeeper
docker pull wurstmeister/kafka
docker pull sheepkiller/kafka-manager

docker run -d --name zookeeper --publish 2181:2181
--volume /etc/localtime:/etc/localtime
--restart=always
wurstmeister/zookeeper

run kafka

docker run --name kafka
-p 9092:9092
--link zookeeper:zookeeper
-e KAFKA_ADVERTISED_HOST_NAME=192.168.1.8
-e KAFKA_ZOOKEEPER_CONNECT=zookeeper:2181
-d wurstmeister/kafka

run kafka manager

docker run -d
--link zookeeper:zookeeper
-p 9000:9000
-e ZK_HOSTS="zookeeper:2181"
hlebalbau/kafka-manager:stable
-Dpidfile.path=/dev/null</pre>

如果想设置webui 的权限,可以这样设置

<pre style="box-sizing: border-box; overflow: auto; font-family: SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13.6px; margin-top: 0px; margin-bottom: 0px; overflow-wrap: normal; padding: 16px; line-height: 1.45; background-color: rgb(246, 248, 250); border-radius: 3px; word-break: normal; tab-size: 4; color: rgb(51, 51, 51);">KAFKA_MANAGER_AUTH_ENABLED: "true"
KAFKA_MANAGER_USERNAME: username
KAFKA_MANAGER_PASSWORD: password</pre>

容器启动成功之后就可以在页面访问localhost:9000查看Kafkfa的管理界面。

:point_right:

快速实现SpringBoot集成Kafka

启动服务

以下的操作是在IDEA下完成

1、将上述部署的几个服务的ip和端口号分别配置在flink-2-hbase和web服务中;

2、在flink-2-hbase中的根目录执行mvn clean install,目的是将其打包并放置在本地仓库中;

3、分别启动task目录下的task(直接在idea中右键启动就行了);

4、把SchedulerJob启动起来,定时的去计算协同过滤和用户画像所需要的分数;

5、在idea中打开web项目,等待其自动引入flink-2-hbase生成的jar包之后,再启动服务就ok了;

注意: 所有的服务启动后,因为没有任何的点击记录,所以就是随机从数据库取得产品,这里需要你在推荐页面随便点击,等有了一定的历史数据之后,就能实现实时推荐的效果了

6. 下一步工作

  1. 添加flink任务监控
  2. 完善数据大屏,显示更详细的指标
  3. 统计召回率/准确率等业务指标
上一篇 下一篇

猜你喜欢

热点阅读