Kafka数据倾斜到某一个分区解决方案

最新推荐文章于 2025-07-08 16:28:10 发布

D-小白兔

最新推荐文章于 2025-07-08 16:28:10 发布

阅读量2.7k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：消息中间件技术类文章标签： kafka 分布式大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36741151/article/details/128732985

技术类同时被 2 个专栏收录

21 篇文章

订阅专栏

消息中间件

5 篇文章

订阅专栏

文章探讨了在使用Kafka时，为了保证消息有序性而指定分区或Key导致的数据倾斜问题。当生产速度超过消费速度，单一分区的数据积压无法通过增加消费者来解决。提出的解决方案包括优化消费端性能和采用多topic进行消息分流，通过特定算法确保相同Key的消息仍落在同一分区，从而实现水平扩展。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、原因：

我们使用Kafka时，某时需要消息消费是有序的，因此在生产者投递消息时，可能会指定分区，或者指定Key，此时可能会导致数据倾斜到某一个分区。

由于Kafka消费的特性，即一个消费组，那怕此时消费组有2个以上消费者，此时同一个主分区，只能被一个消费者消费，当生产消息大于消费消息时，就会出现单一分区数据倾斜。

2、解决：

根本原因，当指定分区，或者指定Key投递消息时。生产消息大于消费消息时，出现单一分区数据倾斜，此时消费端不能水平扩展。解决方案：

1、优化消费端的消费能力，如原来是200ms，优化后是50ms，当然可能无法优化;

2、二次消费用多个topic分摊分流消息，详细如下：

在消费端判定是哪个分区发生倾斜；
为这个发生倾斜的分区，建多个topic分摊分流，二次投递消费，水平扩展服务器；
topic分摊分流，根据指定的Key，弄一个算法，以确保相同的Key落在同一个分区；

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。