使用kafka consumer api时，中文乱码问题

使用Intelli idea调试kafka low consumer时，由于broker存储的message有中文，idea中console端是可以正确显示的然后mvn package打包到服务器上执行，结果中文乱码。然后在kafka consumer代码中byte转为string时，使用了各种编码String mes = new String(bytes,"UTF-8...

weixin_30700977

3108人浏览 · 2014-10-24 18:36:00

weixin_30700977 · 2014-10-24 18:36:00 发布

使用Intelli idea调试kafka low consumer时，由于broker存储的message有中文，

idea中console端是可以正确显示的

然后mvn package打包到服务器上执行，结果中文乱码。

然后在kafka consumer代码中byte转为string时，使用了各种编码

String mes = new String(bytes,"UTF-8");
String mes = new String(bytes,"GBK");
String mes = new String(bytes,"iso8859-1");

问题还是没有解决。然后一直google，摆渡，看到有人说到jvm的默认编码会影响程序的编码，于是在程序中把

Charset.defaultCharset()打印出来，结果，在idea中显示的是UTF-8，在服务器上执行时就变成了US-ASCII。

我整个工程都是以UTF-8编码的，难怪在服务器上中文会乱码了。问题找到了，然后又经过一番折腾，终于解决了问题

在/etc/profile添加HADOOP_OPT="-Dfile encoding=UTF-8"，保存退出 source /etc/profile，重新执行

hadoop jar kafkaHdfs-1.0-SNAPSHOT-jar-with-dependencies.jar org.conan.kafka.AllTopicsConsumer ./hdfs.properties

转载于:https://www.cnblogs.com/zz123/p/4049027.html

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

zookeeper+kafka群集

Kafka开源项目指南

KubeSphere 部署 Kafka 集群实战指南

本文档将详细阐述如何利用 Helm 这一强大的工具，快速而高效地在 K8s 集群上安装并配置一个 Kafka 集群。

Kafka开源项目指南

zookeeper+kafka+ELK+filebeat集群

Kafka开源项目指南

所有评论(0)

查看更多评论

weixin_30700977

@weixin_30700977

已为社区贡献2条内容