Question

У меня есть датафрейм панд, который выглядит следующим образом:

и я хочу получить для каждого отдельного идентификатора строку с максимальной датой, чтобы мои окончательные результаты выглядели примерно так:

Мой столбец даты имеет тип данных «объект». Я пробовал группировать, а затем пытался захватить максимум, как показано ниже:

idx = df.groupby(['ID','Item'])['date'].transform(max) == df_Trans['date']
df_new = df[idx]

Однако я не могу получить желаемый результат. Любая помощь по этому вопросу будет принята с благодарностью!

piRSquared · Answer 1 · 08 ноября 2018

Должно работать, пока index уникален или максимальный индекс не повторяется.

df.loc[df.groupby('ID').date.idxmax()]

Должно работать, пока максимальные значения уникальны.В противном случае вы получите все строки, равные максимуму.

df[df.groupby('ID')['date'].transform('max') == df['date']]

А также очень хорошее решение.

df.sort_values(['ID', 'date']).drop_duplicates('date', keep='last')

Захватить строки с максимальной датой из кадра данных панд

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.