kafka 和 redis 有什么区别？

正常大家都这么问的，但是实际上应该是想问：kafka和redis queue有什么区别？因为redis是一个基于内存的kv数据库，而kafka是分布式发布订阅消息系统。两者本身不是同样一个层次的东西。redis中有一个queue的数据类型，用来做发布/订阅系统，这个就可以和kafka进行比较了哈。存储介质不同redis queue数据是存储在内存，虽然有AOF和RDB的持久化方式，...

短腿长颈鹿小姐

2807人浏览 · 2019-12-31 14:19:50

短腿长颈鹿小姐 · 2019-12-31 14:19:50 发布

正常大家都这么问的，但是实际上应该是想问：kafka和redis queue有什么区别？

因为redis是一个基于内存的kv数据库，而kafka是分布式发布订阅消息系统。两者本身不是同样一个层次的东西。

redis中有一个queue的数据类型，用来做发布/订阅系统，这个就可以和kafka进行比较了哈。

存储介质不同

redis queue数据是存储在内存，虽然有AOF和RDB的持久化方式，但是还是以内存为主。
kafka是存储在硬盘上

性能不同

因为存储介质不同，理论上redis queue的性能要优于kafka，但是在实际使用过程，这块体验并不是很明显，通常只有一些高并发场景下需要用redis queue，比如发红包，可以先将红包预先拆解然后push到redis queue，在抢的一瞬间可以很好的支撑并发。

成本不同

这边要划重点，划重点，划重点。

kafka存储在硬盘上，成本会比内存小很多，具体差1，2个数量级是有，在数据量非常大的情况下，使用kafka能够节省蛮多服务器成本。最常见的有应用产生的日志，这些日志产生的量级一般都很大，如果有需要进行处理，可以使用kafka队列。

消息可靠

redis存储在内存中，一旦服务异常或者宕机，数据就会丢失。相对来说kafka存储在硬盘更加安全。

订阅机制

这边也是比较重点，订阅机制主要有两点不同：

kafka消费了之后，可以重新消费。redis消费（lpop）了数据之后，数据就从队列里消失了。kafka里面是偏移量（offset）的概念，可以设置到前面重新消费。
redis只支持单一的消费者，只有topic模式。kafka不光有topic，还支持group分组模式，可以有多个消费组，消费同一个topic的消息。比如应用产生的行为日志，走kafka就很合适，大数据部门可以消费做数据分析，开发部门可以消费做后续的业务逻辑。

总结

总结来看，主要就是两点：

存储介质不一样，因为存储介质的不同，造成性能、成本、可靠性的差异。
订阅机制不一样。

Kafka开源项目指南

Kafka开源项目指南提供详尽教程，助开发者掌握其架构、配置和使用，实现高效数据流管理和实时处理。它高性能、可扩展，适合日志收集和实时数据处理，通过持久化保障数据安全，是企业大数据生态系统的核心。

更多推荐

Kafka入门（一）概述、部署与API的简单使用

Kafka概述、部署与API的简单使用

Kafka开源项目指南

基于canal和kafka同步，实现binlog同步ElasticSearch

文章目录前言elasticsearch 安装canal安装canal-adapter 安装及配置mysql 安装zk及kafaka安装查看效果注意事项前言中间件版本elasticsearch7.5.2canal1.1.4client-adapter1.1.5-alpha-1zookeeper3.4.13kafka2.6.0mysql5.7.31elasticsearch 安装{"settings"

Kafka开源项目指南

基于 Iceberg 的湖仓一体架构在 B 站的实践

背景在B站，每天都有PB级的数据注入到大数据平台，经过离线或实时的ETL建模后，提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据，如何高效低成本地满足下游数据的分析需求，一直是我们重点的工作方向。我们之前的数据处理流程基本上是这样的：采集端将客户端埋点、服务端埋点、日志、业务数据库等数据收集到HDFS、Kafka等存储系统中，然后通过Hive、Spark、Fl...