Flink kafkaSink 二

这个是接着第一篇写的:主要是实现直接上代码1.实现KeyedSerializationSchema接口public class DefinedSerializationTest implements KeyedSerializationSchema<Tuple2<String, String>> {private static final

新手路上的程序员

1990人浏览 · 2019-01-04 09:15:54

新手路上的程序员 · 2019-01-04 09:15:54 发布

这个是接着第一篇写的:主要是实现直接上代码

1.实现KeyedSerializationSchema接口

public class DefinedSerializationTest implements KeyedSerializationSchema<Tuple2<String, String>> {


    private static final long serialVersionUID = -6095174255432490089L;


    @Override
    public byte[] serializeKey(Tuple2<String, String> element) {
        //序列化key
        return element.f0.getBytes();
    }

    @Override
    public byte[] serializeValue(Tuple2<String, String> element) {
        //序列化value
        return element.f1.getBytes();
    }

    @Override
    public String getTargetTopic(Tuple2<String, String> element) {
        //在发送的时候需要指定topic 这里可以直接返回null
        return null;
    }
}

这个类主要是定义如何序列化key和value

2.继承FlinkKafkaPartitioner

public class PartitionerTest extends FlinkKafkaPartitioner<Tuple2<String, String>> {
    /**
     * @param record      发送的数据
     * @param key         key 值
     * @param value       value值
     * @param targetTopic 发送的topic
     * @param partitions  topic的分区数
     * @return 发送到几号分区
     */
    @Override
    public int partition(Tuple2<String, String> record, byte[] key, byte[] value, String targetTopic, int[] partitions) {
        return 0;
    }
}

3.写一个发送方法

  public void kafkaSendTest(DataStream<Tuple2<String, String>> dataStream, String topic, FlinkKafkaPartitioner flinkKafkaPartitioner) {
        dataStream.addSink(new FlinkKafkaProducer011<>(topic,
                new DefinedSerializationTest(),
                properties,
                Optional.of(flinkKafkaPartitioner))).name("sinkToKafka");
    }

这样就可以自己定义发送的key，value以及分区数

努力吧，皮卡丘

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...