CentOs7 安装比较复杂,个人建议使用Docker容器的方式
如果是服务器上,远程连接kafka需要开放端口

CentOs7 安装

安装Kafka之前需要安装zookeeper

安装zookeeper

安装 zookeeper 需要先安装 jdk;我这里安装的是jdk1.8
安装jdk命令
zookeeper官网地址:http://zookeeper.apache.org/releases.html
下载安装

mkdir /data/zk/
cd /data/zk/
# 下载
wget wget https://mirrors.bfsu.edu.cn/apache/zookeeper/zookeeper-3.7.0/apache-zookeeper-3.7.0-bin.tar.gz 
# 解压文件
tar -zxvf apache-zookeeper-3.7.0-bin.tar.gz 

修改配置

# 创建数据目录和日志目录
mkdir /data/zk/{data,logs}
# 修改配置信息
cp /data/zk/apache-zookeeper-3.7.0-bin/conf/zoo_sample.cfg /data/zk/apache-zookeeper-3.7.0-bin/conf/zoo.cfg
vim /data/zk/apache-zookeeper-3.7.0-bin/conf/zoo.cfg

dataDir=/data/zk/data
dataLogDir=/data/zk/logs
pidfile=/var/run/zookeeper.pid
# the port at which the clients will connect
clientPort=2182 #修改端口	

启动zookeeper

cd /data/zk/apache-zookeeper-3.7.0-bin/bin/
./zkServer.sh start-foreground	

设置 zookeeper 开机自动启动

cd /usr/lib/systemd/system/
vim zoopeeker.service
# 配置文件内容
[Unit]
Description=zookeeperservice
After=network.target
[Service]
Type=forking
PIDFile=/var/run/zookeeper.pid
WorkingDirectory=/data/zk/apache-zookeeper-3.7.0-bin
ExecStart=/data/zk/apache-zookeeper-3.7.0-bin/bin/zkServer.sh start
User=root
Group=root
ExecReload=/bin/kill -s HUP $MAINPID
ExecStop=/bin/kill -s QUIT $MAINPID
PrivateTmp=true
[Install]
WantedBy=multi-user.target

#启动zoopeeker
systemctl enable zoopeeker && systemctl start zoopeeker

安装 Kafka

下载安装

# 创建目录文件
mkdir /data/kafka/
cd /data/kafka/
mkdir /data/kafka/logs/
# 下载
wget https://archive.apache.org/dist/kafka/2.8.0/kafka_2.12-2.8.0.tgz
# 解压
tar -zxvf kafka_2.12-2.8.0.tgz

修改配置

cd /data/kafka/kafka_2.12-2.8.0/config
vim server.properties
# 下面是配置内容
# 如果集群中有多个 broker,则每个 broker 的编号需要设置的不同
broker.id=0
# 修改监听kafka的地址 0.0.0.0 表示所有的ip都能连接
listeners=PLAINTEXT://0.0.0.0:9092
# 修改 zookeeper.connect 为自己的 IP:PORT
zookeeper.connect=localhost:2182/kafka
#存放消息日志文件的地址
log.dirs=/data/kafka/logs/

server.properties 配置详解

//当前机器在集群中的唯一标识,和zookeeper的myid性质一样(broker.id和host.name每个节点都不相同)
broker.id=0
//当前kafka对外提供服务的端口默认是9092listeners=PLAINTEXT://192.168.1.202:9092
//这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
host.name=hadoop1
//这个是borker进行网络处理的线程数
num.network.threads=3
//这个是borker进行I/O处理的线程数
num.io.threads=8
//发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.send.buffer.bytes=102400
//kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.receive.buffer.bytes=102400
//这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
socket.request.max.bytes=104857600
//消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,
//如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
log.dirs=/home/hadoop/log/kafka-logs
//默认的分区数,一个topic默认1个分区数
num.partitions=1
//每个数据目录用来日志恢复的线程数目
num.recovery.threads.per.data.dir=1
//默认消息的最大持久化时间,168小时,7天
log.retention.hours=168
//轮转时间,当需要删除指定小时之前的数据时,该设置项很重要
log.roll.hours=12
//这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.segment.bytes=1073741824
//每隔300000毫秒去检查上面配置的log失效时间
log.retention.check.interval.ms=300000
//是否启用log压缩,一般不用启用,启用的话可以提高性能
log.cleaner.enable=false
//设置zookeeper的连接端口
zookeeper.connect=192.168.123.102:2181,192.168.123.103:2181,192.168.123.104:2181
//设置zookeeper的连接超时时间
zookeeper.connection.timeout.ms=6000

启动Kakfa

nohup /data/kafka/kafka_2.12-2.8.0/bin/kafka-server-start.sh  /data/kafka/kafka_2.12-2.8.0/config/server.properties &
或
/data/kafka/kafka_2.12-2.8.0/bin/kafka-server-start.sh -daemon /data/kafka/kafka_2.12-2.8.0/config/server.properties

参考原文地址: https://blog.csdn.net/shenyuanhaojie/article/details/121200011

Docker 安装

安装zookeeper

docker run -d --name zookeeper -p 2181:2181 -v /etc/localtime:/etc/localtime wurstmeister/zookeeper

在这里插入图片描述

安装 Kafka

docker run  -d --name kafka -p 9092:9092 -e KAFKA_BROKER_ID=0 -e KAFKA_ZOOKEEPER_CONNECT=172.17.0.1:2181 -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://172.17.0.1:9092 -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 -t wurstmeister/kafka

-e KAFKA_BROKER_ID=0 在kafka集群中,每个kafka都有唯一的BROKER_ID来区分自己
-e KAFKA_ZOOKEEPER_CONNECT=172.17.0.1:2181/kafka 配置zookeeper管理kafka的路径172.17.0.1:2181/kafka
-e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://172.17.0.1:9092 把kafka的地址端口注册给zookeeper
-e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092 配置kafka的监听端口
-v /etc/localtime:/etc/localtime 容器同步服务器的时间

查看是否启动成功

docker ps -f name=kafka

在这里插入图片描述

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐