В чем разница между продолжительностью и временем обработки в зависимости от длительности пакета в интерфейсе spark? - PullRequest
0 голосов
/ 28 апреля 2020

Как показано на рисунке ниже, в чем разница между продолжительностью, длительностью партии и временем обработки в пользовательском интерфейсе Spark?

спасибо

Изображение пользовательского интерфейса Spark

Ответы [ 2 ]

0 голосов
/ 28 апреля 2020

batch duration в течение 1 минуты говорит вам, что ваше потоковое приложение Spark работает партиями по 1 минуте, что означает, что оно планирует СДР каждую минуту. Вы устанавливаете эту продолжительность в своем коде при создании SparkSession.

processing time сообщает, что Spark потребовалось 34 секунды для обработки всех входных данных (предоставляется как input data size).

duration дает вам понимание времени, которое потребовалось для завершения sh конкретной работы в вашем приложении.

0 голосов
/ 28 апреля 2020

Продолжительность - настенные часы. Время обработки - это сумма продолжительности всех заданий.

...