Kafka的体系结构
Kafka一开始是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统。现已捐献给Apache基金会。目前的定位是:Kafka是一个分布式流式处理平台。具有高吞吐、可持久化、可水平扩展、支持流数据处理的特点。
是什么
Kafka一开始是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统。现已捐献给Apache基金会。目前的定位是:Kafka是一个分布式流式处理平台。具有高吞吐、可持久化、可水平扩展、支持流数据处理的特点。
功能
消息系统:系统解耦、冗余存储、流量削峰、缓冲、异步通信、扩展性、可恢复性、消息顺序型保障、回溯消费。
存储系统:消息持久化到磁盘,多副本机制。即可把Kafka作为长期的数据存储系统来使用。
流式处理平台:有一个完整的流式处理类库。(窗口、连接、变换和聚合)。
体系结构
一个典型的Kafka体系结构包括若干Producer、若干Broker、若干Consumer,以及一个ZooKeeper集群。如下图:
对于图中出现的概念我们进行一下解释:
- ZooKeeper:是Kafka用来负责集群元数据的管理、控制器的选举等操作的。
- Producer:将消息发送到Broker
- 生产者,发送消息的一方。负责创建消息,然后将其投递到Kafka中。
- Broker:负责将收到的消息存储到磁盘中
- 服务代理节点。对于Kafka而言,Broker可以简单地看作一个独立的Kafka服务节点或Kafka服务实例。大多数情况下也可以将Broker看作一台Kafka服务器,前提是这台服务器上只部署了一个Kafka实例。一个或多个Broker组成了一个Kafka集群。
- Consumer:负责从Broker订阅并消费消息。
- 消费者,接收消息的一方。消费者连接到Kafka上接收消息,进而进行相应的业务逻辑处理。
主题和分区
- 主题(Topic):
- Kafka中的消息以主题为单位进行归类。
- 生产者负责将消息发送到特定的主题,而消费者负责订阅主题进行消费。
- 分区(Partition):
- 主题是一个逻辑上的概念,主题可以细分为多个分区,一个分区只属于单个主题。
- 同一主题下的不同分区包含的消息是不同的,分区在存储层面可以看做一个可追加的日志(Log)文件,消息在被追加到分区日志文件的时候都会分配一个特定的偏移量(offset)。
- offset是消息在分区中的唯一标识,kafka通过它来保证消息在分区内的顺序性。Kafka保证的是分区有序而不是主题有序。
主题和分区的关系
如下图。主题中有4个分区,消息被顺序追加到每个分区日志文件的尾部。Kafka中的分区可以分布在不同的服务器(broker)上,一个主题(topic)可以横跨多个broker,以此来提供比单个broker更强大的性能。
每一条消息被发送到broker之前,会根据分区规则选择存储到哪个具体的分区。如果分区规则设定的合理,所有的消息都可以均匀地分配到不同的分区中。如果一个主题只对应一个文件,那么这个文件所在的机器I/O将会成为这个主题的性能瓶颈,而分区解决了这个问题。在创建主题的时候可以通过指定的参数来设置分区的个数,当然也可以在主题创建完成之后去修改分区的数量,通过增加分区的数量可以实现水平扩展。
分区的多副本(Replica)机制
通过增加副本数量可以提升容灾能力。
同一分区的不同副本中保存的是相同的消息(在同一时刻,副本之间并非完全一样),副本之间是"一主多从"的关系,其中leader副本负责处理读写请求,foller副本只负责与leader副本的消息同步。副本处于不同的broker中,当leader副本出现故障时,从follower副本中重新选举新的leader副本对外提供服务。Kafka通过多副本机制实现了故障的自动转移,当Kafka集群中某个broker失效时仍然能保证服务可用。
如图, Kafka 集群中有4个broker ,某个主题中有3个分区,且副本因子(即副本个数〉也为3 ,如此每个分区便有 1个leader 副本和2个 follower 副本。生产者和消费者只与 leader副本进行交互,而 follow副本只负责消息的同步,很多时候 follower 副本中的消息相对 leader副本而言会有一定的滞后。
Kafka消费端也具备一定的容灾能力。Consumer使用拉(Pull)模式从服务端拉取消息,并且保存消费的具体位置,当消费者宕机后恢复上线时可以根据之前保存的消费位置重新拉取需要的消息进行消费,这样就不会造成消息丢失。
AR(Assigned Replicas)
分区中的所有副本统称为AR(Assigned Replicas)。所有与leader副本保持一定程度同步的副本(包括leader副本在内)组成ISR(In-Sync Replicas)。
ISR 集合是 AR 集合中的一个子集。 消息会先发送到 leader 副本,然后 follower 本才能从 leader 副本中拉取消息进行同步,同步期间内 follower 副本相对于 leader 副本而言会有一定程度的滞后。前面所说的“一定程度的同步”是指可忍受的滞后范围,这个范围可以通过参数进行配置。与leader副本同步滞后过多的副本(不包括leader副本)组成OSR(Out-of-Sync Replicas),由此可见,AR=ISR+OSR。在正常情况下,所有的follower副本都应该与leader副本保持一定程度的同步,即AR=ISR,OSR集合为空。
leader副本负责维护和跟踪ISR集合中所有follower副本的滞后状态,当follower副本落后太多或失效时,leader副本会把它从ISR集合中剔除。如果OSR集合中有follower副本“追上”了leader副本,那么leader副本会把它从OSR集合转移至ISR集合。 默认情况下,当leader副本发生故障时,只有在 ISR 集合中的副本才有资格被选举为新的 leader, 而在 OSR 集合中的副本则没有任何机会(不过这个原则也可以通过修改相应的参数配置来改变)
ISR HW LEO 也有紧密的关系。 HW是 High Watermark 的缩写,俗称高水位,它标识了一个特定的消息偏移量(offset),消费者只能拉取到这个offset之前的消息。
如图,它代表一个日志文件,这个日志文件中有9条消息,第一条消息的offset(LogStartOffset)为 0 ,最后一条消息的 offset 8, offset为9的消息用虚线框表示,代表下一条待写入的消息。日志文件的 HW为6 ,表示消费者只能拉取到 offset 在0至5之间的消息, 而offset为6 的消息对消费者而言是不可见的。
LEO 是Log End Offset的缩写,它标识当前日志文件中下一条待写入消息offset ,图中offset为9的位置即为当前日志文件的 LEO, LEO 的大小相当于当前日志分区中最后一条消 息的 offset 值加1 。分区 ISR 集合中的每个副本都会维护自身的LEO ,而 ISR 集合中最小的 LEO 即为分区的 HW ,对消费者而言只能消费 HW 之前的消息。
具体有关Kafka的使用可以看博主的下一遍博客哦。
感谢您的阅读,如果您感觉本篇博客还不错,请帮忙留言+点赞+收藏呗。~~
更多推荐
所有评论(0)