logstash 6+ 切割nginx日志

读取kafka日志，切割nginx access log一、准备grok pattern在logstash的home路径中，新建patterns文件夹，并新建nginx文件，放入以下内容NGINX_ACCESS %{IPORHOST:remote_addr} (?:-|(%{WORD}.%{WORD})) %{USER:remote_user} \[%{HTTPDATE:time_local...

xushuai110

1892人浏览 · 2019-05-20 22:15:20

xushuai110 · 2019-05-20 22:15:20 发布

读取kafka日志，切割nginx access log

一、准备grok pattern

在logstash的home路径中，新建patterns文件夹，并新建nginx文件，放入以下内容

NGINX_ACCESS %{IPORHOST:remote_addr} (?:-|(%{WORD}.%{WORD})) %{USER:remote_user} \[%{HTTPDATE:time_local}\] "(?:%{WORD:method} %{NOTSPACE:request}(?: HTTP/%{NUMBER:http_version})?|%{DATA:rawrequest})" %{NUMBER:status} (?:%{NUMBER:body_bytes_sent}|-) %{QS:http_referer} %{QS:http_user_agent} %{QS:http_x_forwarded_for} (?:%{NUMBER:request_time}|-) (?:%{NUMBER:upstream_response_time}|-)

二、新建logstash配置文件

input {
 kafka{
    bootstrap_servers => ["10.20.10.1:9092,10.20.10.2:9092,10.20.10.3:9092"]
    client_id => "logstash-jd-sre-bigdata-85-47"
    group_id => "logstash-test"
    auto_offset_reset => "latest"
    consumer_threads => 5
    decorate_events => true
    topics => ["test"]
    codec => json {
        charset => "UTF-8"
    }
  }
 
 
}
 
filter {
    grok {
        patterns_dir => ["./patterns"]
        match => { "message" => "%{NGINX_ACCESS}" }
        remove_field => [ "message" ]
    }
    mutate {
        convert => {
            "upstream_response_time" => "float"
            "request_time" => "float"
            "status" => "integer"
            "body_bytes_sent" => "float"
        }
    }
 
}
 
output {
  elasticsearch {
    hosts => ["10.20.10.1:9200","10.20.10.2:9200","10.20.10.3:9200"]
    index => "logstash-%{[fields][log_topic]}-%{+YYYY.MM.dd}"
  }
}

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...