人工智能-机器学习推荐系统修行之路

推荐算法笔记07_工程实现与评估【上】

2022-02-02  本文已影响0人  Nefelibatas

推荐系统的数据流

典型数据流框架

批处理大数据架构

image-20220106101127328.png

流计算大数据架构

工具

Lambda架构

Kappa架构

推荐系统分布式离线训练

在推荐、广告、搜索等互联网场景下,动则TB甚至PB级数据量。

导致几乎不可能在传统单机环境下完成机器学习模型的训练。

分布式机器学习训练成为唯一选择。

Spark MLlib

image-20220106110135943.png image-20220106110255571.png

Parameter Server

image-20220106111255045.png

同步SGD(先计算每个worker再进入server)

image-20220106111629228.png

异步SGD(机器之间计算速度不同)

image-20220106111731116.png

在t=1 读取worker3会导致结果不一致,此时正常应该是push worker2

pull1

pull2

push1

pull3 【此处正常为push2】

push2

push3

训练加速与结果不一致的解决方案:

image-20220106111833585.png

Sequential:

Eventual:

Bounded Delay:

image-20220106111926908.png

Parameter Server Implementation

针对Bounded Delay的优化

http://www.cs.cmu.edu/~muli/file/ps.pdf

https://www.cs.cmu.edu/~muli/file/parameter_server_osdi14.pdf

Tensorflow

https://www.tensorflow.org/guide/distributed_training?hl=zh-cn

上一篇 下一篇

猜你喜欢

热点阅读