Что может стать причиной повторной попытки этапа в Spark - PullRequest
0 голосов
/ 10 ноября 2018

У меня есть следующие этапы на веб-странице Spark (используется с пряжей):

enter image description here

То, что меня удивляет Stage 0повторите 1, повторите 2. Что может вызвать такую ​​вещь?

Я попытался воспроизвести его самостоятельно и убил все процессы-исполнители (CoarseGrainedExecutorBackend) на одном из моих кластерных компьютеров, но все, что я получил, это некоторые неудачные задачи с описанием Resubmitted (resubmitted due to lost executor).

В чем причина повтора этапа?И что мне интересно, так это то, что количество записей, прочитанных на каждой стадии попытки, было разным:

enter image description here

и

enter image description here

Обратите внимание на 3011506 в Attempt 1 и 195907736 в Attempt 0.Вызывает ли повторение этапа Spark перечитывает некоторые записи дважды?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...