消费者是如何实现rebalance的?

1. 什么是coordinator?

每个consumer group 都会选择一个broker作为自己的coordinator,他是负责监控整个消费组里的各个分区的心跳,以及判断是否宕机,和开启rebalance的。

2. 如何选择coordinator机器

首先对group id 进行hash,接着对__consumer_offsets的分区数量进行取模,默认分区数量是50

__consumer_offsets的分区数量可以通过offsets.topic.num.partitions来设置,找到分区以后,这个分区所在的broker机器就是coordinator机器。

eg:

group id = “group1”

“group1” .hash() % 50 =5

这个时候我们得到了5,那么我们就去看看这个8号分区在那一台机器,然后我们这个group1下的所有消费者就知道了提交offset的时候是往哪个分区去提交offset

3. 消费流程

  1. 每个consumer都会发送JoinGroup请求到我们刚才计算出来的coordinator那台机器和是哪个
  2. 然后coordinator从一个consumer group 中取出一个consumer作为leader
  3. coordinator把consumer group 情况发送给这个leader
  4. 接着leader会负责制定消费方案
  5. 通过SyncGroup发送给coordinator
  6. 接着coordinator就把消费方案下发给所有的consumer,他们会从指定的分区的leader broker开始进行socket连接和进行消息的消费

image-20200802113937950

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐