Я манипулирую данными временных рядов с несколькими внутридневными строками в день. Я хочу иметь возможность принимать решения на основе данных, сгруппированных только по дням, но не как .groupby()
В настоящее время я делаю цикл для чего-то вроде np.unique(df.index.date)
, затем применяю вычисления день ото дня, ноэто занимает много времени на больших наборах данных.
for day in np.unique(df.index.date):
if df[day.strftime("%Y-%m-%d")].count()[0] != 5:
df.drop(df[df.index.date == day].index, inplace=True)
фрагмент данных может выглядеть следующим образом:
Date_Time EB
2018-09-13 9:20:00 69.45
2018-09-13 9:30:00 69.44
2018-09-13 9:40:00 69.33
2018-09-13 9:50:00 69.34
2018-09-13 10:00:00 69.36
2018-09-14 9:20:00 69.45
2018-09-14 9:30:00 69.44
2018-09-14 9:40:00 69.33
2018-09-14 9:50:00 69.34
2018-09-14 10:00:00 69.36
код перебирает каждый день даты-времени и отбрасывает все дни, в которых нет 5 строк.