消息队列-RabbitMQ-基础入门
RabbitMQ
RabbitMQ是Pivotal公司于2007年发布的一款高性能、分布式的消息中间件,同时实现了AMQP(高级消息队列协议)。他是基于Erlang语言编写的,天生支持高并发,同时支持消息高可靠性,支持从内存持久化消息到磁盘,再从磁盘加载消息到内存。
RabbitMQ术语
首先介绍以下几个名词术语:
名词 | 含义 |
---|---|
连接(Connection) | 即客户端与RabbitMQ建立的socket连接。 |
信道(Channel) | 为Connection的通信信道,其中一个connection可以对应多个信道。 |
交换机(Exchange) | 针对生产者,它指定消息按什么规则,路由到哪个队列。(可以理解为快递发送网点) |
队列(Queue) | 用于存储消息,每个消息都会被投入到一个或多个队列。(可以理解为快递到货网点) |
路由键、主题(RoutingKey) | 用于指定交换机和队列的绑定规则,消息只有主题匹配才会到达指定队列。(可以理解为邮寄地址) |
绑定(Binding) | 用于关联交换机和队列,指定交换机按照路由键的规则进行绑定。(可以理解为快递分拣的规则,比如杭州的分到杭州的网点,上海的分到上海的网点,其中杭州网点和上海网点都是“队列”,寄件的网点就是“交换机”) |
举一个例子:商家就好比生产者,发快递网点好比交换机,邮寄地址就是路由键,收快递网点就是队列,分拣规则就是bingding, 收件人就是订阅者。
RabbitMQ基本原理
我们先看一下RabbitMQ模型结构图,这样会方便们更好地去理解RabbitMQ的基本原理。
image.png通过上面这张应用相结合的结构图既能够清晰的看清楚整体的send Message到Receive Message的一个大致的流程。当然上面有很多名词都相比还没有介绍到,不要着急接下来我们就开始对其进行详细的讲解。
Queue
Queue(队列)RabbitMQ的作用是存储消息,队列的特性是先进先出。上图可以清晰地看到Client A和Client B是生产者,生产者生产消息最终被送到RabbitMQ的内部对象Queue中去,而消费者则是从Queue队列中取出数据。可以简化成表示为:
image.png生产者Send Message “A”被传送到Queue中,消费者发现消息队列Queue中有订阅的消息,就会将这条消息A读取出来进行一些列的业务操作。这里只是一个消费正对应一个队列Queue,也可以多个消费者订阅同一个队列Queue,当然这里就会将Queue里面的消息平分给其他的消费者,但会存在一个问题:如果每个消息的处理时间不同,就会导致某些消费者一直在忙碌中,而有的消费者处理完了消息后一直处于空闲状态,因为前面已经提及到了Queue会平分这些消息给相应的消费者。这里我们就可以使用prefetchCount来限制每次发送给消费者消息的个数。详情见下图所示:
image.png这里的prefetchCount=1是指每次从Queue中发送一条消息来。等消费者处理完这条消息后Queue会再发送一条消息给消费者。
Exchange 回忆一下,在开篇TabbitMQ消息模型图中,消费者Client A和消费者Client B是如何知道我发送的消息是给Queue1还是给Queue2。首先明确一点就是生产者产生的消息并不是直接发送给消息队列Queue的,而是要经过Exchange(交换器),由Exchange再将消息路由到一个或多个Queue,当然这里还会对不符合路由规则的消息进行丢弃掉,这里指的是后续要谈到的Exchange Type。那么Exchange是怎样将消息准确的推送到对应的Queue的呢?那么这里的功劳最大的当属Binding,RabbitMQ是通过Binding将Exchange和Queue链接在一起,这样Exchange就知道如何将消息准确的推送到Queue中去。简单示意图如下所示:
image.png在绑定(Binding)Exchange和Queue的同时,一般会指定一个Binding Key,生产者将消息发送给Exchange的时候,一般会产生一个Routing Key,当Routing Key和Binding Key对应上的时候,消息就会发送到对应的Queue中去。那么Exchange有四种类型,不同的类型有着不同的策略。也就是表明不同的类型将决定绑定的Queue不同,换言之就是说生产者发送了一个消息,Routing Key的规则是A,那么生产者会将Routing Key=A的消息推送到Exchange中,这时候Exchange中会有自己的规则,对应的规则去筛选生产者发来的消息,如果能够对应上Exchange的内部规则就将消息推送到对应的Queue中去。那么接下来就来详细讲解下Exchange里面类型。
Exchange Type
我来用表格来描述下类型以及类型之间的区别。
- fanout
fanout类型的Exchange路由规则非常简单,它会把所有发送到该Exchange的消息路由到所有与它绑定的Queue中。
image.png上图所示,生产者(P)生产消息1将消息1推送到Exchange,由于Exchange Type=fanout这时候会遵循fanout的规则将消息推送到所有与它绑定Queue,也就是图上的两个Queue最后两个消费者消费。
- direct
direct类型的Exchange路由规则也很简单,它会把消息路由到那些binding key与routing key完全匹配的Queue中
image.png当生产者(P)发送消息时Rotuing key=booking时,这时候将消息传送给Exchange,Exchange获取到生产者发送过来消息后,会根据自身的规则进行与匹配相应的Queue,这时发现Queue1和Queue2都符合,就会将消息传送给这两个队列,如果我们以Rotuing key=create和Rotuing key=confirm发送消息时,这时消息只会被推送到Queue2队列中,其他Routing Key的消息将会被丢弃。
- topic 前面提到的direct规则是严格意义上的匹配,换言之Routing Key必须与Binding Key相匹配的时候才将消息传送给Queue,那么topic这个规则就是模糊匹配,可以通过通配符满足一部分规则就可以传送。它的约定是:
- routing key为一个句点号
.
分隔的字符串(我们将被句点号.
分隔开的每一段独立的字符串称为一个单词),如“stock.usd.nyse”、“nyse.vmw”、“quick.orange.rabbit” - binding key与routing key一样也是句点号
.
分隔的字符串 - binding key中可以存在两种特殊字符
*
与#
,用于做模糊匹配,其中*
用于匹配一个单词,#
用于匹配多个单词(可以是零个)
当生产者发送消息Routing Key=F.C.E的时候,这时候只满足Queue1,所以会被路由到Queue中,如果Routing Key=A.C.E这时候会被同是路由到Queue1和Queue2中,如果Routing Key=A.F.B时,这里只会发送一条消息到Queue2中。
- headers headers类型的Exchange不依赖于routing key与binding key的匹配规则来路由消息,而是根据发送的消息内容中的headers属性进行匹配。 在绑定Queue与Exchange时指定一组键值对;当消息发送到Exchange时,RabbitMQ会取到该消息的headers(也是一个键值对的形式),对比其中的键值对是否完全匹配Queue与Exchange绑定时指定的键值对;如果完全匹配则消息会路由到该Queue,否则不会路由到该Queue。 该类型的Exchange没有用到过(不过也应该很有用武之地),所以不做介绍。
这里在对其进行简要的表格整理:
类型名称 | 类型描述 |
---|---|
fanout | 把所有发送到该Exchange的消息路由到所有与它绑定的Queue中 |
direct | Routing Key==Binding Key |
topic | 简称模糊匹配,* 用于匹配一个单词,# 用于匹配多个单词(可以是零个) |
headers | Exchange不依赖于routing key与binding key的匹配规则来路由消息,而是根据发送的消息内容中的headers属性进行匹配。 |
消息发布原理
如下图所示,生产者将消息投递给exchange,exchange与queue之间已经事先建立好了某个路由规则binding,exchange根据routingKey和事先建立好的binding进行匹配,决定如何将消息分发给对应的queue。
消息发送的原型.png消息消费原理
消费者订阅指定queue,当消息发送到queue之后,由于RabbitMQ消息消费采用的是push模型,queue会立即将消息发送给订阅了该queue的消费者。
- 如果多个订阅者订阅同一个queue,则消息只会发给其中一个订阅者
- 生产者发送一条消息,希望多个订阅者可以消费(消息广播的场景),多个订阅者就每个人分别订阅一个队列,其中每个队列和exchange建立相同的binding。
要特别注意的是,这种方案实现的消息广播是有瓶颈限制的。因为RabbitMQ进行队列广播时,是需要在内存中复制消息的,如果广播的量不大,10、20个这样的,对性能影响不大;但如果是大量的广播,则会急剧降低RabbitMQ的性能。因此MQ并不适合对端推送,相比较而言,更适用于服务间推送。
补充说明:ConnectionFactory、Connection、Channel
ConnectionFactory、Connection、Channel都是RabbitMQ对外提供的API中最基本的对象。Connection是RabbitMQ的socket链接,它封装了socket协议相关部分逻辑。ConnectionFactory为Connection的制造工厂。Channel是我们与RabbitMQ打交道的最重要的一个接口,我们大部分的业务操作是在Channel这个接口中完成的,包括定义Queue、定义Exchange、绑定Queue与Exchange、发布消息等。
Connection就是建立一个TCP连接,生产者和消费者的都是通过TCP的连接到RabbitMQ Server中的,这个后续会再程序中体现出来。
Channel虚拟连接,建立在上面TCP连接的基础上,数据流动都是通过Channel来进行的。为什么不是直接建立在TCP的基础上进行数据流动呢?如果建立在TCP的基础上进行数据流动,建立和关闭TCP连接有代价。频繁的建立关闭TCP连接对于系统的性能有很大的影响,而且TCP的连接数也有限制,这也限制了系统处理高并发的能力。但是,在TCP连接中建立Channel是没有上述代价的。