Я использую Spark 2.4.
Я перевожу приложение Spark Streaming на структурированную потоковую передачу.
Я работаю над генерацией метрик для каждого пакета и хочу контролировать статистикудля каждой микро партии.Меня интересуют метрики processingDelay
, schedulingDelay
и totalDelay
каждой микробатки и где их найти в структурированной потоковой передаче.
Я пробовал следующий подход, но он не генерирует никакой статистики.
val recentBatchInfos = new StatsReportListener(60).batchInfos
val numberOfRecords = recentBatchInfos.map(_.numRecords).sum
Может кто-нибудь сказать, как использовать контроль над статистикой и генерировать соответствующие метрики?