启动kafka和flume的命令

测试Flume采集的数据能否同时发送到HBase和Kafka集群

芒果香蕉的聚会

2512人浏览 · 2022-10-26 10:08:16

芒果香蕉的聚会 · 2022-10-26 10:08:16 发布

测试Flume采集的数据能否同时发送到HBase和Kafka集群。

（1）启动Kafka

进入/home/hadoop/app/kafka目录，在hadoop01节点上启动消费者，启动命令如下所示。

>>> $ bin/kafka-console-consumer.sh--bootstrap-server localhost:9092 --topic sogoulogs

（2）启动Flume聚合服务

进入/home/hadoop/app/flume目录，在hadoop02和hadoop03节点上分别启动Flume服务，启动命令如下所示。

>>> $ bin/flume-ng agent -n agent1 -c conf -f conf/avro-file-selector-hbase-        
      kafka.properties -Dflume.root.logger=INFO,console

（3）启动Flume采集服务

进入/home/hadoop/app/flume目录，在hadoop01节点上启动Flume服务，启动命令如下所示。

>>> $ bin/flume-ng agent -n agent1 -c conf -f conf/taildir-file-selector-avro.properties 
      -Dflume.root.logger = INFO,consloe

（4）准备测试数据

进入hadoop01节点所在的/home/hadoop/data/flume/logs目录，向监控日志sogou.log文件添加新数据，具体操作如下所示。

>>> $echo '00:00:11 19433525556885 [悉尼大学] 1 65 www.tommorow.edu.cn/' >> sogou.log

（5）查看数据结果

在hbase shell中，利用scan命令查看sogoulogs表中的数据，具体操作如下所示。

>>> $ bin/hbase shell
hbase(main):014:0 > scan 'sogoulogs'

在Kafka消费者控制台中，查看消费sogoulogs主题数据，具体操作如下所示。

>>> $ bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic sogoulogs

如果在HBase数据库和Kafka消息队列中都能查看到采集的数据，说明Flume成功采集了用户行为数据并写入了Kafka和HBase集群。

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...