Какой этап в Apache Spark? - PullRequest
1 голос
/ 08 июля 2019

поэтому я понимаю, что этап - это набор задач, которые работают в одном узле.

так почему я получаю два этапа, когда я работаю в местном масштабе?

1 Ответ

2 голосов
/ 08 июля 2019

Этап - это набор параллельных задач - одна задача на раздел. Количество этапов определяется количеством преобразований в случайном порядке / широких. enter image description here

Итак, возвращаясь к вашему случаю, если у вас есть случайная операция, то это приведет к двум этапам.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...