若是在没有太多经验可借鉴的状况下,要设计一套完整可用的移动端IM架构,难度是至关大的。缘由在于,IM系统(尤为是移动端IM系统)是多种技术和领域知识的横向应用综合体:网络编程、通讯安全、高并发编程、移动端开发等,若是要包含实时音视频聊天的话,则还要加上难度更大的音视频编解码技术(内行都知道,把音视频编解码及相关技术玩透的,博士学位均可以混出来了),凡此种种,加上移动网络的特殊性、复杂性,设计和开发难度不言而喻。
本文分享了一套完整的海量在线用户的移动端IM架构设计,来自于做者的真实项目实践总结,包含了详细的算法原理图、数据结构定义、表结构定义等等。
即时通信网注:本文中的架构设计从实际应用的角度看,其实并不完美,多处设计对于高吞吐高并发的IM应用来讲也是存在单点性能瓶颈的(好比:提供消息交换逻辑的msg_logic服务、提供全局用户状态查询的单点Redis等),另外IM协议设计可能也稍显混乱(但这是仁者见仁智者见者的事了,不能一律而论)。但文章中的大部分算法原理、协议设计等都是值得借鉴的,总之不必照搬,但至少能给你自已的方案设计带来灵感,我想这也是本文或即时通信网的其它相似文章的真正价值所在。php
《浅谈IM系统的架构设计》
《简述移动端IM开发的那些坑:架构设计、通讯协议和客户端》
《一套原创分布式即时通信(IM)系统理论架构方案》
《从零到卓越:京东客服即时通信系统的技术架构演进历程》
《蘑菇街即时通信/IM服务器开发之架构选择》
《腾讯QQ1.4亿在线用户的技术挑战和架构演进之路PPT》
《微信技术总监谈架构:微信之道——大道至简(演讲全文)》
《如何解读《微信技术总监谈架构:微信之道——大道至简》》
《快速裂变:见证微信强大后台架构从0到1的演进历程(一)》
《17年的实践:腾讯海量产品的技术方法论》
>> 更多同类文章 ……html
整体架构包括5个层级,具体内容以下图:
各层级的说明以下:
redis
典型算法逻辑部分描述IM系统核心组件及其协做关系,结构图以下:
客户端从Iplist服务获取接入层IP地址(也可采用域名的方式解析获得接入层IP地址),创建与接入层的链接(可能为短链接),从而实现客户端与IM服务器的数据交互;业务线服务器能够经过服务器端API创建与IM服务器的联系,向客户端推送消息;客户端上报到业务服务器的消息,IM服务器会经过mq投递给业务服务器。
如下将对各子业务的工做原理进行逐一介绍。
算法
用户请求受权时,可能在另外一个设备(同类型设备)开着软件处于登陆状态,这种状况须要系统将那个设备踢下线,以下图:
数据库
注:在第6步和第7步之间,启动计时器(DelayedQueue或哈希环,时间如5秒),计时器时间到后,探测该条消息状态,若是消息未送达,考虑经过APNS、米推、个推动行推送。
编程
采用扩散写(而非扩散读)的方式。
群聊是多人社交的基本诉求,一个群友在群内发了一条消息:缓存
因为“消息风暴扩散系数”的存在,群消息的复杂度要远高于单对单消息。
群基础表:用来描述一个群的基本信息
im_group_msgs(group_id, group_name,create_user, owner, announcement, create_time)
群成员表:用来描述一个群里有多少成员
im_group_users(group_id, user_id)
用户接收消息表:用来描述一个用户的全部收到群消息(与单对单消息表是同一个表)
im_message_recieve(msg_id,msg_from,msg_to, group_id,msg_seq, msg_content, send_time, msg_type, deliverd, cmd_id)
用户发送消息表:用来描述一个用户发送了哪些消息
im_message_send (msg_id,msg_from,msg_to, group_id,msg_seq, msg_content, send_time, msg_type, cmd_id)
业务场景举例:安全
群聊流程以下图所示:
群聊流程详细说明:服务器
下图中,将gate和logic合并为im-server,拉取离线消息流程以下:
微信
ISO采用APNS,Android真后台保活,同时增长米推、个推。基本思路:push提示信息,App经过拉离线得到真实消息。
TCP的数据协议以下图所示,包括header和body两部分:
消息头总共20个字节,具体信息以下表:
消息体协议采用ProtocolBuffer(谷歌)协议(详见文章《Protobuf通讯协议详解:代码演示、详细原理介绍等》),版本3.0.0,该协议在序列化效率、压缩、可扩展方面都具备优点。如下为主要流程涉及的协议。
认证(auth) :
登出(logout) :
踢人(kickout) :
心跳(keepalive,noop):
心跳包消息体为空。
单对单聊天(c2c):
群聊(c2g):
拉离线(pull):
控制类(ctrl)协议:
MySQL数据库采用utf8mb4编码格式(emoji字符问题)。
发送消息表:
保存某个用户发送了哪些消息,用于复现用户聊天场景(消息漫游功能须要)。
推送消息表:
保存某个用户收到了哪些消息。
群基本信息表:
群用户关系表:
用户状态及路由信息:
Redis缓存以uid为key,检索channel(socketid),last_packet_time等。
Gate层,session以channel(socketed)为key,检索uid,及其余信息。
交互接口:gate->logic,经过将channel转换为uid做为key。
logic->gate,将uid转换为channel做为key。
其余缓存信息:
你以为该怎么存就怎么存。
采用商用云存储。
可考虑采用HBase,HDFS做为数据归档,或者相关云存储服务。