задержка планировщика в интерфейсе Spark - PullRequest
0 голосов
/ 01 июля 2019

Я выполняю задания pyspark в кластере 2.3.0 на пряже. Я вижу, что все этапы имеют очень долгую задержку планировщика. НО - это просто максимальное время, 75-й процентиль составляет 28 мс .... все остальные показатели времени очень малы (время GC, десериализация задач и т. д.) почти нет случайного размера записи. локальность меняется в основном между локальными узлами, локальными процессами и локальными стойками. что может быть причиной столь длительного времени задержки планировщика? это пряжа или просто не хватает ресурсов для запуска задач? Поможет ли эта проблема увеличение / уменьшение разделов?

1 Ответ

0 голосов
/ 05 июля 2019

, отвечая на мой собственный вопрос на случай, если у кого-то возникнет такая же проблема - похоже, это связано с искаженными данными, которые вызывали длительные задержки.это было вызвано использованием объединения вместо перераспределения данных, что делило данные неравномерно.Кроме того, я также кэшировал фрейм данных после разбиения, поэтому обработанный выполнялся локально (process_local), а не node_local и rack_locak.

...