生产者

生产者负责创建消息,然后将其投递到Kafka中。
在这里插入图片描述

负载均衡

  1. 轮询策略。
  2. 随机策略。
  3. 按照 key 进行hash。

Kafka 的默认分区策略:如果指定了 key,key 相同的消息会发送到同一个分区(分区有序);如果没有指定 key,则使用轮询策略。

发送消息

acks指定了生产者在多少个分区副本收到消息的情况下才会认为消息写入成功。

三种方式并没有优劣之分,而是要因地制宜的选择合适的策略。需要在性能和可靠性之间权衡。

发送消息有以下3种方式:

发送并忘记。

acks = 0。
生产者发送消息之后不会等待任何来自broker的响应。大多数情况下,消息可以成功送达,因为Kafka是高可用的,而且生产者有自动尝试重发的机制。但是,如果发生了不可重试的错误或超时,那么消息将会丢失,应用程序将不会收到任何信息或异常。
在其他配置环境相同的情况下,acks 设置为0 可以达到最大的吞吐量。

异步发送

acks=1,默认值。
生产者发送消息之后,只要分区的leader副本成功写入消息,那么它就会收到来自服务端的成功响应。

  • 如果消息无法写入leader副本,比如在leader 副本崩溃、重新选举新的 leader 副本的过程中,那么生产者就会收到一个错误的响应,为了避免消息丢失,生产者可以选择重发消息。
  • 如果消息写入leader副本并返回成功响应给生产者,且在被其他follower副本拉取之前leader副本崩溃,那么此时消息还是会丢失,因为新选举的leader副本中并没有这条对应的消息。
    acks设置为1,是消息可靠性和吞吐量之间的折中方案。
同步发送

acks = -1 或 acks = all。
生产者在消息发送之后,需要等待ISR中的所有副本都成功写入消息之后才能够收到来自服务端的成功响应。
在其他配置环境相同的情况下,acks 设置为-1(all)可以达到最强的可靠性。但这并不意味着消息就一定可靠,因为ISR中可能只有leader副本,这样就退化成了acks=1的情况。

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐