Question

У меня есть датафрейм за месяц, исключая субботу и воскресенье, который регистрировался каждую 1 минуту.

                            v1         v2  
2017-04-03 09:15:00     35.7       35.4  
2017-04-03 09:16:00     28.7       28.5
      ...               ...        ...
2017-04-03 16:29:00     81.7       81.5
2017-04-03 16:30:00     82.7       82.6
      ...               ...        ...
2017-04-04 09:15:00     24.3       24.2  
2017-04-04 09:16:00     25.6       25.5
      ...               ...        ...
2017-04-04 16:29:00     67.0       67.2
2017-04-04 16:30:00     70.2       70.6
      ...               ...        ...
2017-04-28 09:15:00     31.7       31.4  
2017-04-28 09:16:00     31.5       31.0
      ...               ...        ...
2017-04-28 16:29:00     33.2       33.5
2017-04-28 16:30:00     33.0       30.7

У меня есть ресэмпл, чтобы получить 1-е и последнее значение каждого дня.

res = df.groupby(df.index.date).apply(lambda x: x.iloc[[0, -1]])
res.index = res.index.droplevel(0)
print(res)
                      v1    v2
2017-04-03 09:15:00  35.7  35.4
2017-04-03 16:30:00  82.7  82.6
2017-04-04 09:15:00  24.3  24.2
2017-04-04 16:30:00  70.2  70.6
   ...                ..    ..
2017-04-28 09:15:00  31.7  31.4
2017-04-28 16:30:00  33.0  30.7

Теперь я хочу организовать фрейм данных в виде даты с минимальной временной отметкой v1 и максимальной временной отметкой v2 конкретной даты.

Желаемый вывод:

              v1    v2
2017-04-03  35.7  82.6
2017-04-04  24.3  70.6
   ...       ..    ..
2017-04-28  31.7  30.7

Arthur Vandergood · Answer 1 · 21 октября 2018

В пандах есть очень интересная функция для работы с индексом datetime.Это функция пересэмплирования.В вашем случае попробуйте следующее:

def first_last(entry):
   return entry['v1'][0],entry['v2'][1]

yourdataframe.resample('D').apply(first_last)

'D' означает ежедневную повторную выборку.

результат:

Dates                 
2017-04-03  35.7  82.6
2017-04-04  24.3  70.6

Abhi · Answer 2 · 21 октября 2018

Вы можете группировать по индексу и использовать groupby.agg с пользовательской функцией.

df1 = res.groupby(res.index.date).agg({'v1': lambda x: x[min(x.index)], 'v2':lambda x: x[max(x.index)]})

print (df1)

             v1      v2
2017-04-03  35.7    82.6
2017-04-04  24.3    70.6
2017-04-28  31.7    33.7

Альтернатива повторной выборке фрейма данных для получения 1-го и последнего значения за каждый день.

res=df.reset_index().groupby(df.index.date).agg(['first','last']).stack().set_index('index')

Out[123]:

                      v1     v2
index       
2017-04-03 09:15:00  35.7   35.4
2017-04-03 16:30:00  82.7   82.6
2017-04-04 09:15:00  24.3   24.2
2017-04-04 16:30:00  70.2   70.6
2017-04-28 09:15:00  31.7   31.4
2017-04-28 16:30:00  33.0   33.7

jpp · Answer 3 · 21 октября 2018

Вы можете reset_index, а затем GroupBy + apply с пользовательской функцией:

def first_second(x):
    return pd.Series({'v1': x['v1'].iat[0], 'v2': x['v2'].iat[-1]})

res2 = res.reset_index()
res2 = res2.groupby(res2['index'].dt.date).apply(first_second)

print(res2)

              v1    v2
index                 
2017-04-03  35.7  82.6
2017-04-04  24.3  70.6
2017-04-28  31.7  33.7

CezarySzulc · Answer 4 · 21 октября 2018

Попробуйте это:

df_result = pd.DataFrame()
df_result['v1'] = res.groupby(res.index)['v1'].min()
df_result['v2'] = res.groupby(res.index)['v2'].max()

Панды - как организовать фрейм данных на основе даты и назначить новые значения столбцу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Панды - как организовать фрейм данных на основе даты и назначить новые значения столбцу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов