IM

[转载]一套海量在线用户的移动端IM架构设计实践分享(含详细图文

2019-01-09  本文已影响0人  佛心看世界

1、写在前面

1.1、引言

如果在没有太多经验可借鉴的情况下,要设计一套完整可用的移动端IM架构,难度是相当大的。原因在于,IM系统(尤其是移动端IM系统)是多种技术和领域知识的横向应用综合体:网络编程、通信安全、高并发编程、移动端开发等,如果要包含实时音视频聊天的话,则还要加上难度更大的音视频编解码技术(内行都知道,把音视频编解码及相关技术玩透的,博士学位都可以混出来了),凡此种种,加上移动网络的特殊性、复杂性,设计和开发难度不言而喻。

本文分享了一套完整的海量在线用户的移动端IM架构设计,来自于作者的真实项目实践总结,包含了详细的算法原理图、数据结构定义、表结构定义等等。

即时通讯网注:本文中的架构设计从实际应用的角度看,其实并不完美,多处设计对于高吞吐高并发的IM应用来说也是存在单点性能瓶颈的(比如:提供消息交换逻辑的msg_logic服务、提供全局用户状态查询的单点Redis等),另外IM协议设计可能也稍显混乱(但这是仁者见仁智者见者的事了,不能一概而论)。但文章中的大部分算法原理、协议设计等都是值得借鉴的,总之没必要照搬,但至少能给你自已的方案设计带来灵感,我想这也是本文或即时通讯网的其它类似文章的真正价值所在。

另外,如果您正打算从零开发移动端IM,则建议您从《新手入门一篇就够:从零开发移动端IM》一文开始,此文按照IM开发所需的知识和技能要求,拟定了详尽的学习提纲和建议等。

2、服务器端设计

2.1、总体架构设计

总体架构包括5个层级,具体内容如下图:

各层级的说明如下:

2.2、典型算法逻辑

典型算法逻辑部分描述IM系统核心组件及其协作关系,结构图如下:

客户端从Iplist服务获取接入层IP地址(也可采用域名的方式解析得到接入层IP地址),建立与接入层的连接(可能为短连接),从而实现客户端与IM服务器的数据交互;业务线服务器可以通过服务器端API建立与IM服务器的联系,向客户端推送消息;客户端上报到业务服务器的消息,IM服务器会通过mq投递给业务服务器。

以下将对各子业务的工作原理进行逐一介绍。

2.2.1登录授权(auth)流程原理

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_3.jpg

2.2.2登出(logout)流程原理

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_4.jpg

2.2.3踢人(kickout)流程原理

用户请求授权时,可能在另一个设备(同类型设备)开着软件处于登录状态,这种情况需要系统将那个设备踢下线,如下图:


一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_5.jpg

2.2.4上报(c2s)流程原理

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_6.jpg

2.2.5推送(s2c)流程原理

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_7.jpg

2.2.6单对单聊天(c2c)流程原理

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_8.jpg

注:在第6步和第7步之间,启动计时器(DelayedQueue或哈希环,时间如5秒),计时器时间到后,探测该条消息状态,如果消息未送达,考虑通过APNS、米推、个推进行推送。

2.2.7群聊(c2g)流程原理

采用扩散写(而非扩散读)的方式。

群聊是多人社交的基本诉求,一个群友在群内发了一条消息:

由于“消息风暴扩散系数”的存在,群消息的复杂度要远高于单对单消息。

群基础表:用来描述一个群的基本信息
im_group_msgs(group_id, group_name,create_user, owner, announcement, create_time)

群成员表:用来描述一个群里有多少成员
im_group_users(group_id, user_id)

用户接收消息表:用来描述一个用户的所有收到群消息(与单对单消息表是同一个表)
im_message_recieve(msg_id,msg_from,msg_to, group_id,msg_seq, msg_content, send_time, msg_type, deliverd, cmd_id)

用户发送消息表:用来描述一个用户发送了哪些消息
im_message_send (msg_id,msg_from,msg_to, group_id,msg_seq, msg_content, send_time, msg_type, cmd_id)

业务场景举例:

群聊流程如下图所示:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_9.jpg

群聊流程详细说明:

2.2.8拉取离线消息流程原理

下图中,将gate和logic合并为im-server,拉取离线消息流程如下:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_10.jpg

2.3、后台PUSH(推送)

iOS采用APNS,Android真后台保活,同时增加米推、个推。基本思路:push提示信息,App通过拉离线获得真实消息。

3、协议设计

3.1、IM协议总体定义

TCP的数据协议如下图所示,包括header和body两部分:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_11.jpg

消息头总共20个字节,具体信息如下表:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_12.jpg

3.2、各具体的IM协议体定义

消息体协议采用ProtocolBuffer(谷歌)协议(详见文章《Protobuf通信协议详解:代码演示、详细原理介绍等》),版本3.0.0,该协议在序列化效率、压缩、可扩展方面都具有优势。以下为主要流程涉及的协议。

认证(auth) :

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_13.jpg

登出(logout) :

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_14.jpg

踢人(kickout) :

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_15.jpg

心跳(keepalive,noop):
心跳包消息体为空。

单对单聊天(c2c):

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_16.jpg 一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_17.jpg

群聊(c2g):

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_18.jpg 一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_19.jpg

拉离线(pull):

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_20.jpg

控制类(ctrl)协议:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_21.jpg 一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_23-2.jpg

4、存储设计

4.1、MySQL数据库

MySQL数据库采用utf8mb4编码格式(emoji字符问题)。

4.2、主要表结构

发送消息表:
保存某个用户发送了哪些消息,用于复现用户聊天场景(消息漫游功能需要)。

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_22.jpg

推送消息表:
保存某个用户收到了哪些消息。

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_23.jpg

群基本信息表:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_24.jpg

群用户关系表:

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_25.jpg

4.3、水平分库

一套海量在线用户的移动端IM架构设计实践分享(含详细图文)_26.jpg

4.4、Redis缓存

用户状态及路由信息:
Redis缓存以uid为key,检索channel(socketid),last_packet_time等。
Gate层,session以channel(socketed)为key,检索uid,及其他信息。
交互接口:gate->logic,通过将channel转换为uid作为key。
logic->gate,将uid转换为channel作为key。

其他缓存信息:
你觉得该怎么存就怎么存。

4.5、文件及图片存储

采用商用云存储。

4.6、数据归档

可考虑采用HBase,HDFS作为数据归档,或者相关云存储服务。

安全部分略,其他非核心功能略。

(原文链接:点此进入,有改动)

上一篇下一篇

猜你喜欢

热点阅读