利用Pulsar搭建事件驱动的serverless平台
Serverless的概念
Serverless是说开发的应用不再需要关心服务器,将应用程序需要的资源当作是一种服务,这使得应用owner能快速的进行应用的迭代,运维变得非常简单。常见的serverless平台:
- AWS lambda
- Google function
- 阿里云的函数服务
Serverless架构下,业务处理逻辑被当作是一个函数或者一个微服务,按照以往的架构模式,我们在架构设计上往往是考虑如何建立一个系统,它能响应多个消息事件,并对这些消息事件做业务处理,最终将结果进行输出或者存储,如果使用serverless平台,在架构设计上将转变为设计一个服务或者一个函数,用于响应某个事件,并对此事件做处理,将处理结果进行存储或者输出
Pulsar介绍
pulsar是新一代MQ,详情见:https://www.jianshu.com/p/0bc4989f9bb0
Pulsar对存储的支持
Pulsar中支持sink操作,并提供了多个connector支持数据的sink,其处理模型非常简单:
imagePulsar对sink的支持使得我们可以非常简单的在pulsar中使用外部存储或者其它MQ,例如hbase, mysql等数据库或者Kafka等MQ。Pulsar支持的connector:
- Aerospike sink
- Cassandra sink
- Kafka sink
- Kinesis sink
- RabbitMQ source
Pulsar对函数的支持
Pulsar function支持轻量级的计算处理,它可以从多个topic接收输入,并将处理结果输出到其它topic,或者进行sink,处理模型如下:
image函数支持与broker在同一容器上运行或者与broker分别在不同的容器中运行两种运行方式:
- 与broker在同一容器中运行时,function-worker是broker的一部分,示意图如下:
- 与broker分别在不同的容器中运行时,function-worker可独立于broker扩展,且运行时互不影响,示意图如下:
Pulsar支持java, python和go语言编写函数,引入pulsar function sdk后,使用Java编写函数示例如下 :
public class ExclamationFunction implements Function<String, String> {
@Override
public String process(String input, Context context) {
return String.format("%s!", input);
}
}
只需要实现Function接口即可,编写完函数后,对函数所在的工程编译打包后可通过命令部署到pulsar,部署时可指定运行函数所使用的资源情况,比如使用使用8c8g10g的资源部署函数:
$ bin/pulsar-admin functions create \
--jar target/my-functions.jar \
--classname org.example.functions.MyFunction \
--cpu 8 \
--ram 8589934592 \
--disk 10737418240
部署可使用命令行,rest api或者java admin api
对schema的支持
消息中都是byte[],但是在消息处理的过程中,计算逻辑不能直接处理byte[],需要有序列化反序列化和schema的支持,pulsar支持schema的注册,支持json/protobuf等序列化和反序列化方式,pulsar的生产者,消费者和函数都可以使用schema,可通过schema在生产者,消费者和pulsar function之间传递数据。schema可通过命名行,rest api和java admin api创建。
定义schema文件:
{
"type": "<schema-type>",
"schema": "<an-utf8-encoded-string-of-schema-definition-data>",
"properties": {} // the properties associated with the schema
}
-
type:Schema的类型,比如JSON,STRING等
-
schema:Schema的定义
-
如果是STRING或者基础数据类型,则可以为空
-
如果是结构化的数据,则schema的定义是一个json
-
properties:附加的属性
例如schema定义:
{
"type": "JSON",
"schema": "{"type":"record","name":"User","namespace":"com.foo","fields":[{"name":"file1","type":["null","string"],"default":null},{"name":"file2","type":"string","default":null},{"name":"file3","type":["null","string"],"default":"dfdf"}]}",
"properties": {}
}