Cloudera Manager安装Kafka集群

一、前提条件和环境1、环境：CDH5.16.x|Centos7.x|scala 2.112、CM和CDH环境已经搭建完成。在CDH上集成Kafka，要求用CDH上的Zookeeper管理Kafka。二、相关软件下载cloudera官网kafka：https://docs.cloudera.com/documentation/kafka/latest/topics/kafka_p...

鲲鹏小飞猪

2185人浏览 · 2019-11-26 22:58:45

鲲鹏小飞猪 · 2019-11-26 22:58:45 发布

一、前提条件和环境

1、环境：CDH5.16.x|Centos7.x|scala 2.11

2、CM和CDH环境已经搭建完成。在CDH上集成Kafka，要求用CDH上的Zookeeper管理Kafka。

二、相关软件下载

cloudera官网kafka：

https://docs.cloudera.com/documentation/kafka/latest/topics/kafka_packaging.html

简要说明：例如kafka_2.11-2.2.1-kafka-4.1.0.jar
2.11 scala 版本
2.2.1 apache kafka版本
4.1.0 cdk版本

下载下面的三个文件（Linux版本是6系列，选择el6，7系列选择el7）

1、在/var/www/html/（http服务的默认目录）新建文件夹kafka_parcel。

mkdir kafka_parcel

2、将上面的三个文件上传到该目录下，并将KAFKA-4.1.0-1.4.1.0.p0.4-el7.parcel.sha1重命名为KAFKA-4.1.0-1.4.1.0.p0.4-el7.parcel.sha。

三、安装过程

1、添加Kafka服务

2、安装Parcel

配置：下载-》分配-》激活

Kafka parcel激活完成！

3、集群添加kafka服务安装：

Missing required value: Destination Broker List
Missing required value: Source Broker List

可按如下方法配置即可：
a. 填写Source Brokers List
填写Kafka Broker所在节点构成的列表（用逗号分隔），如下（所有节点部署了Kafka Broker）：
master:9092,slave1:9092,slave2:9092

b. 填写Destination Brokers List
若添加了Kafka MirrorMaker，则可填写其所在节点构成的列表；若未添加Kafka MirrorMaker，可填写任意服务器即可，如下：
master:9092,slave1:9092,slave2:9092
或：example.com:9092

完成配置后继续下一步，完成安装！

4、whitelist must be specified报错（配置了Kafka MirrorMaker角色），在配置界面搜索whitelist添加机器：

四、测试Kafka

cd /opt/cloudera/parcels/KAFKA/bin/
./kafka-topics --create --zookeeper bigdata001:2181 --replication-factor 3 --partitions 3 --topic zyl_test
模拟生产者
./kafka-console-producer --broker-list bigdata001:9092 --topic zyl_test
模拟消费者
./kafka-console-consumer --bootstrap-server bigdata001:9092 --topic zyl_test --from-beginning

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...