Spark SaveAsTable занимает много времени - PullRequest
0 голосов
/ 21 сентября 2018

Я пытаюсь выполнить несколько соединений на разных таблицах улья с помощью Spark и также пытаюсь сохранить финальный стол в улье.

Проблема в том, что этап SaveAsTable занимает почти 12 minutes.Таблица имеет 16 million row.

Есть два исполнителя и всего создано 64 задания.Проблема заключается в том, что все задачи обрабатываются вокруг 17 МБ , однако последняя задача обрабатывает 250 МБ данных.

Я попытался выполнить перераспределение на 264, однако он создаетновый этап после вышеупомянутого этапа.что странно

Please check the picture here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...