logstash从kafka拉取数据,并插入到hdfs中

配置文件如下:

input {
  kafka {
    type => "test"
    auto_offset_reset => "smallest"
    group_id => "mon2"
    topic_id => "db100"
    zk_connect => "192.168.199.6:2181,192.168.199.7:2181,192.168.199.8:2181"
  }
}


output {
  webhdfs {
    server => "192.168.199.6:50070"        
    path => "/logstash/dt=%{+YYYY-MM-dd}/logstash-%{+HH}.log"  
    user => "root"                      
  }
}


注意:

需要安装插件。bin/logstash-plugin install logstash-output-webhdfs


Logo

Kafka开源项目指南提供详尽教程,助开发者掌握其架构、配置和使用,实现高效数据流管理和实时处理。它高性能、可扩展,适合日志收集和实时数据处理,通过持久化保障数据安全,是企业大数据生态系统的核心。

更多推荐