Оптимизирована ли «группа по» в искровом SQL? - PullRequest
0 голосов
/ 31 октября 2018

Объединяются ли данные в каждом разделе? Как мы все знаем, если использовать redubyKey , данные объединяются в каждом разделе, только один вывод для одного ключа в каждом разделе для отправки по сети. ReduceByKey требуется объединить все ваши значения в другое значение с точно таким же типом. Я имею в виду, это как redubykey ?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...