Ray

2020-12-20  本文已影响0人  sleep_NULL

简介

ray 是伯克利大学开源的一个解决 AI 异构计算负载的通用分布式计算引擎,初期主要是解决强化学习这种多类型负载的计算问题,目前其应用面也超出 AI 领域,例如蚂蚁将其应用于图计算等场景

计算模型

ray 提供了 task 和 actor 两种计算原语

@ray.remote
def f(x):
    return x * x
@ray.remote
class Counter(object):
    def __init__(self):
        self.n = 0

    def increment(self):
        self.n += 1

    def read(self):
        return self.n

系统构成

Ray cluster

ray 由若干个同质的 Worker node 及一个 Head node 组成
每个 Worker node 包括一个 Raylet 进程及若干个 Worker 进程, Head node 除了 Worker node 包含的进程外,还包括 Driver 及 GCS

特点

上一篇 下一篇

猜你喜欢

热点阅读