当前位置：首页 > news >正文

IM系统群消息推送方案

news 2025/7/1 13:40:54

场景：a、b、c 位于同一个群中。a、b 在线，c 离线
常见的消息推送流程如下：

上述这种推送模型是“写扩散”，如果群里有 200 个用户，最坏的情况一条消息需要存储199次，消息扩散系数为 n-1 。

同一份消息存储了多份，极大的增加了数据库的存储压力。

存储离线消息时，可以只存储消息的 seq_id (唯一 id)。这样消息本体只存储一份，可以大幅度的降低数据库的冗余数据。

假设 a 在群里连续发了 100 条消息，那么 c 的离线消息库里面将会有对应 100 条记录。

有必要吗？

聪明的你肯定想到了我们可以只存储 c 的last_ack_seq_id(最后一次收到的消息的 seq_id)。因为 c 离线后的所有消息都是未收到的。在 c 上线时，拉取群内 last_ack_seq_id 后的消息即可。

现在的流程如下：

虽然 websocket 是基于 tcp 实现的，但是仍然需要我们在应用层引入相关机制，确保消息可靠传输。因为 tcp 的可靠传输针对的是传输层，对应用层不负责，例如：客户端成功接收消息，但是消息处理失败。

参考 tcp 的可靠传输，我们可以引入 ack 应答、超时重传、去重机制。

首先我们需要确保服务端一定收到消息。

其次我们需要确保客户端一定收到消息。

至于离线用户，不用管他

那我问你，这样真的就没问题了吗？

客户端向服务端发送消息的过程没有问题，问题在服务端修改 last_ack_seq_id 时
例如：

由于网络的原因，无法保证服务端接收 ack 的顺序，我们可以使用 redis 解决这个问题。我们在 redis 中定义两个类型数据结构：list，hash。list 中维护着服务器在当前群组中推送消息的顺序。hash 中维护着消息的状态，是否 ack。发送消息流程如下：

服务端在 redis 的 list 中添加消息1，再在 hash 把消息1 的状态设为 pending，发送消息1
服务端在 redis 的 list 中添加消息2，再在 hash 把消息2 的状态设为 pending，发送消息2
b 返回了消息2 的 ack
服务端将 hash 中的消息2 状态设为 acknowledged，判断队头元素是否为acknowledged状态，此时队头 member 为消息1，消息1的状态为pending，跳出循环
b 返回了消息1 的 ack
服务端将 hash 中的消息1 状态设置为 acknowledged，断队头元素是否为acknowledged状态，此时队头 member 为消息1，消息1的状态为acknowledged，弹出消息1，重复操作，直到队头 member 状态为 pending
服务端更新 MySQL 中群成员关系表中的的 last_act_seq_id 字段