Извлечение строк из кадра данных панд на основе условия - PullRequest
0 голосов
/ 09 октября 2019

У меня есть данные dataframe от pandas, и я хочу сохранить только те строки, в которых сумма «numb_people» для категории «class» составляет не менее 2.

Это, однако, приводит к ошибке индекса(индексы больше не совпадают):

data = data[data.groupby('class').sum()['numb_people'] > 2]

Как я могу сделать это так же просто?

1 Ответ

1 голос
/ 09 октября 2019

Как сказал @rafaelc в комментарии:

idx = data.groupby('class').numb_people.transform('sum') > 2
print(data[idx])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...