Pandas: удалить дубликаты нескольких условий на основе значений столбцов - PullRequest
0 голосов
/ 10 апреля 2020

У меня большой многоиндексный фрейм данных с множеством столбцов с множеством дублированных временных меток.

Теперь я хочу удалить дубликаты, но проблема в том, что я хочу сохранить максимальное значение для столбца 1 и последнего значения для других столбцов.

timestep        headers
        col1    col2    col3
1       2       5       6
1       1       3       4
2       3       5       6
2       4       7       8


Should give


timestep        headers
        col1    col2    col3
1       2       3       4
2       4       7       8

1 Ответ

1 голос
/ 10 апреля 2020

Если вы .groupby() в индексе, вы можете взять .max() каждого столбца:

df.groupby(df.index).max()
   col1  col2  col3
1     2     3     4
2     4     7     8
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...