У меня блестящая работа со многими исполнителями.
Я хочу иметь возможность использовать счетчик на исполнителях для подсчета количества вхождений события. Например, посчитайте, сколько раз столбец «столбец» равен 10.
df.map(df => if(df.get("column")==10){ counter.inc } ; df)
В конечном итоге я хочу, чтобы итоговая сумма была суммой счетчиков для всех исполнителей.
Возможно ли это?
Когда мы сообщаем о метриках из драйвера искры, мы расширяем org. apache .spark.metrics.source.Source и регистрируем его в искровой среде. можно ли использовать эти показатели на исполнителях?