сохраняйте N самых больших строк, даже если дубликаты присутствуют в кадре данных панд - PullRequest
0 голосов
/ 02 июня 2018

В этом фрейме данных:

region  area    other
alabama 99151.5 0.564506436
alabama 99151.5 0.193809515
arkansas    165927  0.878569179
arkansas    165927  0.00946268
arkansas    165927  0.075263353
colorado    408747  0.62052038
colorado    408747  0.723038731
georgia 117363  0.970624899
georgia 117363  0.534441671
idaho   198303  0.378282313
idaho   198303  0.836349349

Я хочу сохранить 2 верхние области по площади, однако я не могу использовать команду pandas nlargest, так как она не позволяет мне хранить дубликаты в столбце области.Как мне это сделать?

- РЕДАКТИРОВАТЬ:

Ожидаемый результат:

region  area    other
colorado    408747  0.62052038
colorado    408747  0.723038731
idaho   198303  0.378282313
idaho   198303  0.836349349

1 Ответ

0 голосов
/ 02 июня 2018

Вам может понадобиться sort_values до groupby head

df.sort_values(['area','other']).groupby('area').head(2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...