【Flink】分区策略

一杯咖啡半杯糖

已于 2022-12-07 17:25:30 修改

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Flink实战文章标签： flink 大数据 big data

于 2022-02-10 10:45:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_23225111/article/details/122855511

Flink实战专栏收录该内容

95 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了Flink的分区策略，包括GlobalPartitioner、ShufflePartitioner、RebalancePartitioner、RescalePartitioner、BroadcastPartitioner、ForwardPartitioner、KeyGroupStreamPartitioner、CustomPartitionerWrapper和BinaryHashPartitioner，并通过示例展示了它们各自的工作原理和使用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

flink1.13用什么策略把数据发送到下个算子中呢？

在分布式计算中，flink把数据集依据不同的策略发送到下游算子中，而策略的实现由分区器决定，flink所有的分区器都实现了ChannelSelector 接口，下面是ChannelSelector的实现类

由实现类我们知道有9种分区器

GlobalPartitioner

数据会被分发到下游算子的第一个实例中进行处理。

ShufflePartitioner

数据会被随机分发到下游算子的每一个实例中进行处理。

RebalancePartitioner

数据会被循环发送到下游的每一个实例中进行处理。

RescalePartitioner

这种分区器会根据上下游算子的并行度，循环的方式输出到下游算子的每个实例。这里有点难以理解，假设上游并行度为2，编号为A和B。下游并行度为4，编号为1，2，3，4。那么A则把数据循环发送给1和2，B则把数据循环发送给3和4。假设上游并行度为4，编号为A，B，C，D。下游并行度为2，编号为1，2。那么A和B则把数据发送给1，C和D则把数据发送给2。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一杯咖啡半杯糖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。