一、是否存在数据倾斜问题 如果生产者指定了key,可以考虑是否存在数据倾斜,调整key的生成策略可以解决,如果没指定key,则默认情况下是不会产生数据倾斜的 二、kafka分区不合理 海量数据下,分区过少,则会造成下游的消费者并行消费的能力降低,而且数据的容灾也不靠谱 三、消费者批量处理 每次拉取消息的时候,可以选择批量处理,当然这个和业务也有关系,比如你一次取10条,现在你第一条没处理成功,但是第10条处理成功了,这个时候还要考虑如何提交offset的问题。