1. 原理
第一轮聚合的时候,对key进行打散,将原先一样的key,变成不一样的key,相当于是将每个key分为多组;
先针对多个组,进行key的局部聚合,接着,再去除掉每个key的前缀,然后对所有的key,进行全局的聚合
2. 使用场景
groupByKey
reduceByKey
这叫适合这种方式,join,就不会这样来做了
1. 原理
第一轮聚合的时候,对key进行打散,将原先一样的key,变成不一样的key,相当于是将每个key分为多组;
先针对多个组,进行key的局部聚合,接着,再去除掉每个key的前缀,然后对所有的key,进行全局的聚合
2. 使用场景
groupByKey
reduceByKey
这叫适合这种方式,join,就不会这样来做了