У меня есть фрейм данных с меткой времени, и я сгруппировал его по 15 минутам в день, чтобы узнать среднюю эмиссию за месяц. Вот пример кадра данных:
plant CEMS Timestamp emission
HINDALCO Ltd., CEMS-3 2018-07-01 07:16:30 71
HINDALCO Ltd., CEMS-4 2018-07-01 07:20:27 63.75
Mideast CEMS-1 2018-07-01 07:22:31 491.25
ores_isp CEMS-1 2018-07-01 07:22:34 367.81
Suraj P. CEMS-1 2018-07-01 07:22:48 39.56
Jindal CEMS-26 2018-07-01 07:22:34 1
HINDALCO Ltd., CEMS-5 2018-07-01 07:20:27 33.75
Итак, теперь я должен обнаружить, что если в течение 15 минут не было получено данных от 80% растений, то это может быть проблема с сервером, и среднее значение не должно учитываться в этом 15-минутном интервале. Помогите мне найти это, пожалуйста.
Я использую этот код, чтобы найти среднее значение «выброса» 15-минутного интервала.
fMin = wn.groupby(['plant_name', 'CEMS', pd.Grouper(key='timestamp', freq='15Min')],as_index=False).count()
fMin = fMin[fMin['emission']>0]
fMl = len(fMin)
fMinA = (fMl * 100) / (96 * dayCount)