JNPF云平台之多租户的探索
在云领域我们常常会听到一个词:多租户。这个词在不同的语境中有着不同的含义。本文将介绍云平台中的多租户的概念以及实现多租户支持的思路。
什么是租户
刚开始接触这个概念时,你肯定感觉“租户”这个词怪怪的。但假设我们换个词,我相信你立即就有感觉了。这个词就是“客户”(这里的客户指的就是商业上面的客户)。
一个租户就是一个客户,比方我们开发的服务是给 XXX 企业使用的,那该企业就是我们的一个客户/租户;假设这个服务是面向互联网的,那么使用该服务的每一个互联网用户都是一个客户/租户。
为什么须要多租户支持
开发人员辛辛苦苦开发出一个服务。提供给了个人/企业使用,这样就完事了么?当然不应该仅仅是这样。我们开发出一个服务。最好是可以同一时候提供给多个个人/企业使用。并且这些客户最好是共享同一套服务执行时(Runtime),这样可以大大减少服务的运维成本:
-
服务执行时假设分开,则运维的成本与客户数成正比(比方更新部署大量客户的场景)
-
节省资源(将服务所需资源利用最大化:运维团队统一、硬件使用)
另外,这样也能够减少服务的开发成本:
-
我们仅仅须要考虑怎样实现单用户的服务逻辑:业务逻辑相应其全部客户都是同样的,不管什么客户来使用,程序提供的服务都是一样的。进一步说,在业务层面我们开发这个服务时理论上不须要考虑多客户支持,我们仅仅用关注该服务的业务逻辑怎样实现
-
多客户的管理功能能够进行统一:开发人员应该不用考虑客户管理功能,这部分应该是由云平台统一提供的
多租户场景举例
如果我们要开发的服务是一个博客平台,这个服务是面向互联网用户的,每一个互联网用户都是我们的客户(一个用户就是一个租户)。
在不支持多租户的环境中,为了隔离每一个用户的数据,至少我们在设计数据库表时会考虑大多数表都存在一个 user_id 字段。用于 CRUD 数据时使用该字段进行用户隔离。
比方如今的业务是“公布文章”。须要将文章数据保存在 article 表中,在实现时实际上我们关注了两件事情:
-
CRUD:这是业务逻辑实现的一部分
-
用户隔离:须要增加 user_id。做业务关联
1 是“纯”业务逻辑部分的实现。这是必须实现的;
2 则是为了多用户博客平台而须要考虑的,这并非博客平台本身的业务逻辑。
这里假设能得到平台的多租户支持,就不用考虑第 2 点了。这样能够将注意力集中于第 1 点业务逻辑实现上,这是很典型的一个多租户场景。
多租户支持
我们能够这样理解多租户支持:
-
从服务提供的角度看。我们开发的一个服务执行时能够同一时候提供给多个客户使用。而且客户之间的数据/状态是保持隔离的
-
从服务使用的角度看,我和你能够作为不同的客户同一时候使用同一个执行的服务,此时我们使用该服务完毕的业务是相互不影响的,就好像我们在使用自己独享的服务一样
那么这个服务就是支持多“客户”的,即该服务支持多租户。这里的“服务”能够是应用,能够是 SaaS 平台,也能够是 PaaS 平台。只是按眼下我们熟悉的云平台看,应用的多租户支持应该是最常规的。这是由于应用面向的是用户,这个群体是非常庞大的。
多租户支持从实现的角度看。“是一种软件架构技术”,之所以强调它是属于架构层面是由于要实现它必须在做技术架构时就要将其考虑在内。
一种租户模型
本文一开始我们提到使用“客户”来置换“租户”来理解租户的含义。再从“商业”这个方面来看的话,我们不难发现租户事实上就是其云环境中的商业模式实现的一部分。商业模式是多样的。这意味着租户的划分也是多样的。这里我们描写叙述当中一种可能的租户栈:
-
应用程序是提供给用户使用的,对于应用来说,用户就是它的租户(这一点业界比較统一)
-
SaaS 提供的服务是给应用开发商使用的,对于 SaaS 来说,应用开发商就是它的租户
-
PaaS 提供的服务是给应用系统使用的,对于 PaaS 来说。相关应用的组合就是它的租户
SaaS 和 PaaS 面向的是开发商、系统等非端用户角色。这一部分通常是由云平台开发人员决定的(捆绑商业模式)。特别是私有/企业云平台一般不会考虑形如“在 PaaS 平台上支持执行多个 SaaS 平台”这种场景。所以以下我们很多其它的是环绕“应用对多租户支持”进行讨论。
应用多租户
应用多租户的使用场景前面已经介绍过了。如今如果我们是一个云平台开发人员,为了满足支持应用支持多租户的需求,在云平台中我们须要提供以下几个支持:
-
租户管理:CRUD,统计
-
租户隔离/共享的服务:队列、缓存、数据库等
-
租户隔离的统计:日志、配额
这些支持能够分为两类:
-
租户的管理:不会直接面向应用的端用户。面向的是应用的运维。平台应该提供详细实现
-
租户数据/状态的隔离:从请求開始就应该能够区分这个请求是来自于哪个租户,请求处理时在调用链路上也须要带上租户上下文。数据的存取是依照租户隔离的。调用平台提供的服务时也是租户隔离的
第 1 点比较easy实现。这是一个业务模型方面的问题,能够依据业务域来抽象租户模型,比方企业应用通常是依照“组织机构”来区分租户的;
第 2 点是一个纯技术的需求。须要在平台技术实现上支持按“租户”的执行时隔离,我们强调的是隔离,由于在实现时我们要达到的目标就是隔离,仅仅只是这里是按租户(租户仅仅是一个商业概念,技术层面我们最好能够将其进行抽象。尽量减小商业模式多样化对技术架构的冲击)。我们能够将租户映射到一个抽象概念上,这个抽象概念能够实现我们的隔离需求。
命名空间
前面我们讨论多租户支持都是自上而下的:从应用多租户需求到数据隔离实现;如今我们再换种视角,自下而上:先通过命名空间隔离数据,再将命名空间提供给应用多租户的实现使用。自下而上的目的主要是在平台内部,我们可以通过“命名空间”来进行数据/状态隔离的抽象。终于的理想情况是命名空间不仅可以支持应用多租户实现,还可以可选择性地暴露命名空间 APIs。让应用可以进行某些数据的隔离(比方缓存)。方便业务实现。
隔离的实现
租户请求从开始到结束平台都须要知晓这个请求映射的命名空间。从请求处理栈我们能够这样大致划分一下:
-
负载均衡器(LB)
-
应用容器(APP)
-
平台服务接口(RPC)
-
平台服务实现(DB/Cache/MQ....)
在这个栈中每一层平台都是须要知道这个请求相应的命名空间的。平台能够提供一个统一登录的服务,将租户信息映射为命名空间并保存到用户会话中,这样每次该用户的请求:
-
过 LB 时就能够区分出命名空间来
-
在 APP 容器中能够通过会话
-
RPC 时传递命名空间
-
依据服务的不同进行命名空间实现(比如 DB 依据命名空间使用不同的 Schema,MQ 依据命名空间使用不同的队列)
这里我们使用的隔离实现基本思路是“Shared application”,即多租户共享一个应用,相应一套基础设施。
一种平台设计
前面谈了这么多,如今我们能够脑补出一种支持应用多租户的云平台:
(这里的设计思路也包括了有的租户要求独享资源的场景)
总结
-
租户和客户的概念类似
-
对多租户的支持我们一般指的是应用对多租户的支持
-
在技术层面支持多租户须要实现数据/状态隔离
-
使用命名空间进行隔离实现抽象
-
租户到命名空间的映射可由平台集成