уменьшение по ключу с последующим foreachpartition в искре - PullRequest
0 голосов
/ 04 октября 2018

Я понимаю, в spark, что редукционный ключ будет сначала уменьшать локально на каждом разделе, а затем выполнять случайное перемешивание.Тем не менее, если у меня есть RedubyKey, за которым следует действие foreachpartition, будет ли redubykey по-прежнему выполнять глобальное уменьшение или оно будет ограничивать уменьшение для каждого уровня раздела и не будет перемешивать различные разделы?

1 Ответ

0 голосов
/ 04 октября 2018

Последующее действие никак не влияет на reduceByKey.Независимо от того, что это reduceByKey (или любой другой подобный метод) будет перетасовывать данные как обычно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...