kafka切换节点数据丢失问题和配置优化

公司项目遇到消息队列数据丢失的问题，以此记录下解决方案。如果kafka的leader挂掉，切换副本节点时产生数据丢失问题，此时一般是要求起码设置如下 4 个参数：给 topic 设置replication.factor参数：这个值必须大于 1，要求每个 partition 必须有至少 2 个副本。在 Kafka 服务端设置min.insync.replicas参数：这个值必须大于 1，这个是要求一

铃木之影

2329人浏览 · 2022-02-13 16:01:21

铃木之影 · 2022-02-13 16:01:21 发布

公司项目遇到消息队列数据丢失的问题，以此记录下解决方案。

如果kafka的leader挂掉，切换副本节点时产生数据丢失问题，此时一般是要求起码设置如下 4 个参数：

给 topic 设置 replication.factor 参数：这个值必须大于 1，要求每个 partition 必须有至少 2 个副本。
在 Kafka 服务端设置 min.insync.replicas 参数：这个值必须大于 1，这个是要求一个 leader 至少感知到有至少一个 follower 还跟自己保持联系，没掉队，这样才能确保 leader 挂了还有一个 follower 吧。
在 producer 端设置 acks=all：这个是要求每条数据，必须是写入所有 replica 之后，才能认为是写成功了。
在 producer 端设置 retries=MAX（很大很大很大的一个值，无限次重试的意思）：这个是要求一旦写入失败，就无限重试，根据业务我们设置的三次重试。

kafka保证消息可靠性，可以通过如下几个配置: