1.准备工作

准备三台服务器

kafka1:192.168.36.242

kafka2:192.168.36.243

kafka3:192.168.36.244

三台服务器关闭防火墙和selinux

systemctl stop firewalld && setenforce 0

2.安装JDK(8版本)

        上传JDK8,并解压到/usr/local/目录下(三台都执行如下操作):

[root@kafka1 ~]# rz      #上传
[root@kafka1 ~]# tar xf jdk-8u211-linux-x64.tar.gz -C /usr/local/   #解压
[root@kafka1 ~]# mv /usr/local/jdk1.8.0_211/ /usr/local/java  #改名方便后续操作
[root@kafka1 ~]# echo '   
> JAVA_HOME=/usr/local/java
> PATH=$JAVA_HOME/bin:$PATH
> export JAVA_HOME PATH
> ' >>/etc/profile   #追加系统全局的登录时执行的命令和环境变量设置
[root@kafka1 ~]# source /etc/profile  #重载文件
[root@kafka1 ~]# echo $?   #检查是否有误
0

3.安装配置ZK

Kafka运行依赖ZK,Kafka官网提供的tar包中,已经包含了ZK,这里不再额下载ZK程序。

        安装(三台都执行如下操作):

[root@kafka1 ~]# rz   #上传
[root@kafka1 ~]# tar xf kafka_2.11-2.0.0.tgz -C /usr/local/   #解压到指定目录
[root@kafka1 ~]# mv /usr/local/kafka_2.11-2.0.0/ /usr/local/kafka  #改名方便后续操作
[root@kafka1 ~]# echo '
> dataDir=/opt/data/zookeeper/data 
> dataLogDir=/opt/data/zookeeper/logs
> clientPort=2181 
> tickTime=2000 
> initLimit=20 
> syncLimit=10 
> server.1=192.168.36.242:2888:3888             
> server.2=192.168.36.243:2888:3888
> server.3=192.168.36.244:2888:3888
> '> /usr/local/kafka/config/zookeeper.properties   #修改文件,并查看是否有多余空格请删除
[root@kafka1 ~]# echo $?
0

配置项含义解释:


dataDir ZK数据存放目录。
dataLogDir  ZK日志存放目录。
clientPort  客户端连接ZK服务的端口。
tickTime        ZK服务器之间或客户端与服务器之间维持心跳的时间间隔。
initLimit       允许follower(相对于Leaderer言的“客户端”)连接并同步到Leader的初始化连接时间,以tickTime为单位。当初始化连接时间超过该值,则表示连接失败。
syncLimit   Leader与Follower之间发送消息时,请求和应答时间长度。如果follower在设置时间内不能与leader通信,那么此follower将会被丢弃。
server.1=172.16.244.31:2888:3888    2888是follower与leader交换信息的端口,3888是当leader挂了时用来执行选举时服务器相互通信的端口。


        创建data、log目录(三台都执行如下操作):

[root@kafka1 ~]# mkdir -p /opt/data/zookeeper/{data,logs}

        创建myid文件:

#/usr/local/kafka/config/zookeeper.properties里的server.id在/opt/data/zookeeper/data/myid编写相应id,不然容易出错

[root@kafka1 ~]# echo 1 > /opt/data/zookeeper/data/myid
[root@kafka2 ~]# echo 2 > /opt/data/zookeeper/data/myid
[root@kafka3 ~]# echo 3 > /opt/data/zookeeper/data/myid

        配置Kafka:

#注意检查broker.id是否与/opt/data/zookeeper/data/myid中的server.id对应
[root@kafka1 ~]# echo '
broker.id=1
listeners=PLAINTEXT://192.168.36.242:9092
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/opt/data/kafka/logs
num.partitions=6
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=2
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=168
log.segment.bytes=536870912
log.retention.check.interval.ms=300000
zookeeper.connect=192.168.36.242:2181,192.168.36.243:2181,192.168.36.244:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=0
' >/usr/local/kafka/config/server.properties

[root@kafka2 ~]# echo '
broker.id=2
listeners=PLAINTEXT://192.168.36.243:9092
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/opt/data/kafka/logs
num.partitions=6
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=2
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=168
log.segment.bytes=536870912
log.retention.check.interval.ms=300000
zookeeper.connect=192.168.36.242:2181,192.168.36.243:2181,192.168.36.244:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=0
' >/usr/local/kafka/config/server.properties

[root@kafka3 ~]# echo '
broker.id=3
listeners=PLAINTEXT://192.168.36.244:9092
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/opt/data/kafka/logs
num.partitions=6
num.recovery.threads.per.data.dir=1
offsets.topic.replication.factor=2
transaction.state.log.replication.factor=1
transaction.state.log.min.isr=1
log.retention.hours=168
log.segment.bytes=536870912
log.retention.check.interval.ms=300000
zookeeper.connect=192.168.36.242:2181,192.168.36.243:2181,192.168.36.244:2181
zookeeper.connection.timeout.ms=6000
group.initial.rebalance.delay.ms=0
' >/usr/local/kafka/config/server.properties

        配置项含义:


broker.id   每个server需要单独配置broker id,如果不配置系统会自动配置。
listeners       监听地址,格式PLAINTEXT://IP:端口。
num.network.threads 接收和发送网络信息的线程数。
num.io.threads          服务器用于处理请求的线程数,其中可能包括磁盘I/O。
socket.send.buffer.bytes    套接字服务器使用的发送缓冲区(SO_SNDBUF)
socket.receive.buffer.bytes 套接字服务器使用的接收缓冲区(SO_RCVBUF)
socket.request.max.bytes        套接字服务器将接受的请求的最大大小(防止OOM)
log.dirs        日志文件目录。
num.partitions  partition数量。
num.recovery.threads.per.data.dir       在启动时恢复日志、关闭时刷盘日志每个数据目录的线程的数量,默认1。
offsets.topic.replication.factor        偏移量话题的复制因子(设置更高保证可用),为了保证有效的复制,偏移话题的复制因子是可配置的,在偏移话题的第一次请求的时候可用的broker的数量至少为复制因子的大小,否则要么话题创建失败,要么复制因子取可用broker的数量和配置复制因子的最小值。
log.retention.hours 日志文件删除之前保留的时间(单位小时),默认168
log.segment.bytes   单个日志文件的大小,默认1073741824
log.retention.check.interval.ms 检查日志段以查看是否可以根据保留策略删除它们的时间间隔。
zookeeper.connect   ZK主机地址,如果zookeeper是集群则以逗号隔开。
zookeeper.connection.timeout.ms     连接到Zookeeper的超时时间。


        创建log目录(三台都执行如下操作):

[root@kafka1 ~]# mkdir -p /opt/data/kafka/logs

4.启动、验证ZK集群

        启动(三台依次执行如下操作):

[root@kafka1 ~]# cd /usr/local/kafka/
[root@kafka1 kafka]# nohup bin/zookeeper-server-start.sh config/zookeeper.properties &
[1] 56997
[root@kafka1 kafka]# nohup: 忽略输入并把输出追加到"nohup.out"

[root@kafka1 kafka]# 

        验证,查看ZK配置(三台都执行如下操作):

#下载nmap
[root@kafka1 kafka]# yum -y install nmap
[root@kafka1 kafka]# echo conf | nc 127.0.0.1 2181
clientPort=2181
dataDir=/opt/data/zookeeper/data/version-2
dataLogDir=/opt/data/zookeeper/logs/version-2
tickTime=2000
maxClientCnxns=60
minSessionTimeout=4000
maxSessionTimeout=40000
serverId=1
initLimit=20
syncLimit=10
electionAlg=3
electionPort=3888
quorumPort=2888
peerType=0

        查看ZK状态(三台都执行如下操作):

[root@kafka1 kafka]# echo stat |nc 127.0.0.1 2181
Zookeeper version: 3.4.13-2d71af4dbe22557fda74f9a9b4309b15a7487f03, built on 06/29/2018 00:39 GMT
Clients:
 /127.0.0.1:43740[0](queued=0,recved=1,sent=0)

Latency min/avg/max: 0/0/0
Received: 3
Sent: 2
Connections: 1
Outstanding: 0
Zxid: 0x100000000
Mode: follower
Node count: 4

       查看端口(三台都执行如下操作):

[root@kafka1 kafka]# lsof -i:2181
COMMAND   PID USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
java    56997 root   96u  IPv6 264433      0t0  TCP *:eforward (LISTEN)

5.启动、验证Kafka

         启动(三台依次执行如下操作):

[root@kafka1 ~]# cd /usr/local/kafka/
[root@kafka1 kafka]# nohup bin/kafka-server-start.sh config/server.properties &
[1] 56997
[root@kafka1 kafka]# nohup: 忽略输入并把输出追加到"nohup.out"

[root@kafka1 kafka]# 

           验证:

        在192.168.36.242上创建topic:

[root@kafka1 kafka]# bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic testtopic
Created topic "testtopic".

        查询192.168.36.242上的topic:

[root@kafka1 kafka]# bin/kafka-topics.sh --zookeeper 192.168.36.242:2181 --list               
testtopic

        查询192.168.36.243上的topic:

[root@kafka2 kafka]# bin/kafka-topics.sh --zookeeper 192.168.36.243:2181 --list               
testtopic

        查询192.168.36.244上的topic:

[root@kafka3 kafka]# bin/kafka-topics.sh --zookeeper 192.168.36.244:2181 --list               
testtopic

        模拟消息生产和消费 发送消息到192.168.36.242:

[root@kafka1 ~]# bin/kafka-console-producer.sh --broker-list 192.168.36.242:9092 --topic testtopic  
>Hello World!

        从192.168.36.243接受消息:

[root@kafka2 ~]# bin/kafka-console-consumer.sh --bootstrap-server  192.168.36.242:9092 --topic testtopic --from-beginning 
Hello World!

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐