Как определить, присутствуют ли данные в определенном интервале данных, а узнать среднее для другого столбца - PullRequest
0 голосов
/ 14 сентября 2018

У меня есть фрейм данных с меткой времени, и я сгруппировал его по 15 минутам в день, чтобы узнать среднюю эмиссию за месяц. Вот пример кадра данных:

   plant         CEMS          Timestamp        emission

HINDALCO Ltd.,  CEMS-3      2018-07-01 07:16:30  71
HINDALCO Ltd.,  CEMS-4      2018-07-01 07:20:27  63.75
Mideast         CEMS-1      2018-07-01 07:22:31  491.25
ores_isp        CEMS-1      2018-07-01 07:22:34  367.81
Suraj P.        CEMS-1      2018-07-01 07:22:48  39.56
Jindal          CEMS-26     2018-07-01 07:22:34  1
HINDALCO Ltd.,  CEMS-5      2018-07-01 07:20:27  33.75

Итак, теперь я должен обнаружить, что если в течение 15 минут не было получено данных от 80% растений, то это может быть проблема с сервером, и среднее значение не должно учитываться в этом 15-минутном интервале. Помогите мне найти это, пожалуйста.

Я использую этот код, чтобы найти среднее значение «выброса» 15-минутного интервала.

fMin = wn.groupby(['plant_name', 'CEMS', pd.Grouper(key='timestamp', freq='15Min')],as_index=False).count()
fMin = fMin[fMin['emission']>0]
fMl = len(fMin)
fMinA =  (fMl * 100) / (96 * dayCount)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...