Nginx整合Kafka

Nginx：一个高性能的HTTP和反向代理web服务器，实际生产中一般用作负载均衡；Kafka：一种高吞吐量的分布式发布订阅消息系统，实际生产中一般用作流式处理中间件；Nginx和Kafka都有非常优秀的性能，实际生产中，往往都是通过Nginx记录日志生成日志文件，然后再通过Flume将日志文件的内容读取到Kafka，中间会有一个写文件和读文件操作，性能势必会受到一些影响；下面介绍一下把Nginx

jackyan163

3710人浏览 · 2022-01-10 17:13:32

jackyan163 · 2022-01-10 17:13:32 发布

Nginx：一个高性能的HTTP和反向代理web服务器，实际生产中一般用作负载均衡；
Kafka：一种高吞吐量的分布式发布订阅消息系统，实际生产中一般用作流式处理中间件；

Nginx和Kafka都有非常优秀的性能，实际生产中，往往都是通过Nginx记录日志生成日志文件，然后再通过Flume将日志文件的内容读取到Kafka，中间会有一个写文件和读文件操作，性能势必会受到一些影响；

下面介绍一下把Nginx的日志直接写入到Kafka的实现过程：

1.安装git

git主要用于拉取源码文件

yum install -y git

2.下载librdkafka源码包

切换到/usr/local/src目录，然后将kafka的c客户端源码clone到本地

cd /usr/local/src
git clone https://github.com/edenhill/librdkafka

3.进入到librdkafka，然后进行编译浏览

cd librdkafka
# 安装必要的包
yum install -y gcc gcc-c++ pcre-devel zlib-devel
./configure
make && make install

4.下载ngx_kafka_module源码包

安装nginx整合kafka的插件，进入到/usr/local/src，clone nginx整合kafka的源码

cd /usr/local/src
git clone https://github.com/brg-liuwei/ngx_kafka_module

5.安装nginx整合kafka的插件

进入到nginx的源码包目录下（编译nginx，然后将将插件同时编译）

cd /usr/local/src/nginx-1.20.2
./configure --add-module=/usr/local/src/ngx_kafka_module/
make
make install

6.修改nginx的配置文件

[root@hadoop100 conf]# vim nginx.conf

    #                  '$status $body_bytes_sent "$http_referer" '
    #                  '"$http_user_agent" "$http_x_forwarded_for"';

    #access_log  logs/access.log  main;

    sendfile        on;
    #tcp_nopush     on;

    #keepalive_timeout  0;
    keepalive_timeout  65;

    #gzip  on;
    #
    # ############### kafka config ###########################
    kafka;
    kafka_broker_list hadoop101:9092 hadoop102:9092 hadoop103:9092;
    # ############### kafka config ###########################

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;

        #access_log  logs/host.access.log  main;

        #location / {
        #    root   html;
        #    index  index.html index.htm;
        #}
       # ############### kafka config ###########################
        location /kafka/test {
                kafka_topic     test;
        }
       # ############### kafka config ###########################
        #error_page  404              /404.html;

        # redirect server error pages to the static page /50x.html
        #
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }

7.启动zk和kafka集群(创建topic)

bin/kafka-topics.sh --zookeeper hadoop101:2181 --create --topic test --partitions 3 --replication-factor 2

8.启动nginx，报错，找不到kafka.so.1的文件

error while loading shared libraries: librdkafka.so.1: cannot open shared object file: No such file or directory

9.加载so库

echo "/usr/local/lib" >> /etc/ld.so.conf
ldconfig

10.测试，向nginx中写入数据，然后观察kafka的消费者能不能消费到数据

curl localhost/kafka/track -d "message send to kafka topic"

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

zookeeper+kafka群集

Kafka开源项目指南

KubeSphere 部署 Kafka 集群实战指南

本文档将详细阐述如何利用 Helm 这一强大的工具，快速而高效地在 K8s 集群上安装并配置一个 Kafka 集群。

Kafka开源项目指南

zookeeper+kafka+ELK+filebeat集群

Kafka开源项目指南

所有评论(0)

查看更多评论

jackyan163

@qq_42409495

已为社区贡献2条内容