1、保证消息消费的有序性

2、在多个consumer组的并发处理消息的情况下,保证有序性和负载均衡。

具体实现策略:



将一组相关的消息组成一个topic

再将一个topic划分成若干区partition,这些区将分布在集群中的各个服务器上。而且各个服务器上都除了存放leader分区外还备份topic其余分区,当对应的leader分区所在服务器挂掉后,随机选一个备份的服务器作为新的leader。从而实现负载均衡。partition

而每个partition中,对于消费者,在消费消息的时候需要维护的是消息在partition中的位置,按序消费消息。consumer也可以通过指定消费消息的位置来消费消息,而且consumer很轻量级,读取消息时不会对其他consumer或者集群造成影响。


producer可以决定消息发布在哪个分区,如果不指定,则简单的由负载均衡机制随机选择分区,也可以通过特定的分区函数来实现消息指定分区发布(更加常用)。


消息发布有两种方式:队列模式和发布-订阅模式;

队列模式:服务端发布的消息,所有consumer都去读,但是能读到消息的只有一个。

发布-订阅模式:消息被广播到所有的consumer。

kafka中可以对consumer进行分组,每个consumer组内的所有consumer竞争topic中的一个消息,只有一个组成员可以消费到。

对于队列模式,实现即为所有的consumer只有一个组,即一条消息只会被一个consumer消费。

对于发布-订阅模式,实现即为每个consumer都有一个组,即一条消息会被发给所有的consumer。往往来说,这种模式体现为一个topic下有若干个消费分组,而不是单个consumer.可以保证消息的稳定性



Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐