最近项目老发生kafka节点莫名其妙就会挂掉的现象,避免项目出现问题,所以借鉴了一下网上大佬的脚本进行了对应的修改。这个脚本会监控Kafka节点,如果出现kafka节点挂掉会自动重启kafka节点。

#!/bin/sh
source /etc/profile                                        # 环境变量
proc_dir="/data/kafka/kafka_2.12-1.1.1"    # 程序目录
proc_name="kafka.Kafka"                          # 进程名
error_name="/data/kafka/kafkaError.log"  # kafka报错文件
file_name="/data/kafka/kafkaError.log"     # 日志文件
number=`ps -ef | grep $proc_name | grep -v grep | wc -l`
PIDS=$(ps ax | grep $proc_name | grep java | grep -v grep | awk '{print $1}')
if [ $number -eq 0 ]                                    # 判断进程是否存在
then
        su - kafka                                             # 切换用户
        cd /data/kafka/kafka_2.12-1.1.1/bin
        sh $proc_dir/bin/kafka-server-start.sh -daemon $proc_dir/config/server.properties     # 重启进程
        pid=$(ps ax | grep $proc_name | grep java | grep -v grep | awk '{print $1}')   #获取新进程号
        echo "服务出现异常.正在重启中..." [$(date +'%F %H:%M:%S')]  >> $error_name
        echo "服务启动完成" PID: $pid [$(date +'%F %H:%M:%S')] >> $file_name # 将新进程号和重启时间记录
else
        echo "kafka正常运行" [$(date +'%F %H:%M:%S')] "pid:" $PIDS  >> $file_name
fi

底下是crontab定时脚本;我写的是每10分钟巡检一次

*/10 * * * * lzmhqa /bin/sh /data/kafka/kafka.sh

自动巡检kafka进程号并自启_李轮清的博客-CSDN博客

Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐