Я импортировал свой набор данных в панду DataFrame.Каждая строка представляет собой одно чтение (амплитуда) из определенной системы (id) в определенную отметку времени (time_stamp).В каждой системе есть несколько показаний.
Я хотел бы выбрать самое последнее среднесуточное значение для каждой системы.
Это пример моего набора данных:
df.head(6)
time_stamp amplitude
id
id1 2018-06-19 00:36:00 16163.1
id1 2018-06-19 01:19:00 16399.7
id1 2018-06-19 01:24:00 16463.3
id1 2018-06-19 03:51:00 16139.4
id2 2018-03-17 03:41:00 11886.0
id2 2018-03-17 03:41:00 12293.6
Столбец с метками времени был преобразован в pd.TimeStamp:
df.dtypes
time_stamp datetime64[ns]
amplitude float64
dtype: object
Я начал с вычисления среднесуточного значения для каждой системы.
Для этого у меня естьзаменил отметки времени датами, сгруппировал строки по системному идентификатору (индексу) и рассчитал среднее значение для каждой даты.Это создает DataFrame с MultiIndex ['id', 'date']
av = df.copy()
# work with dates rather than time stamps
av['date'] = av.time_stamp.dt.date
av.drop('time_stamp', axis=1, inplace=True)
# calculate daily means for each system
av = av.groupby([av.index,'date']).mean()
av
amplitude
id date
id1 2018-03-17 13923.500
2018-04-17 14130.325
2018-12-22 13532.650
id2 2018-03-17 12234.720
2018-04-17 12367.050
id3 2018-06-19 16291.375
На этом этапе я застреваю.
Может кто-нибудь подсказать, как я могу создать новый DataFrame споследние средние значения для каждой системы.Примерно так:
date amplitude
id
id1 2018-12-22 13532.650
id2 2018-04-17 12367.050
id3 2018-06-19 16291.375
Спасибо