Могу ли я получить статистику профилирования для каждой задачи в PySpark? - PullRequest
0 голосов
/ 18 ноября 2018

Я пытаюсь исследовать запутанные задачи в своем задании PySpark (задачи, которые занимают намного больше времени, чем задачи p50 / p75), чтобы понять, почему некоторые задачи выполняются намного дольше по сравнению с другими задачами на той же стадии.

Стандартный профилировщик PySpark предоставляет статистическую статистику для СДР, но есть ли способ получить профилирующую статистику на уровне задачи?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...