Работа с пандами - PullRequest
       12

Работа с пандами

0 голосов
/ 12 ноября 2018

Я использую кадры данных pandas для обработки своего набора данных. У меня есть 3 столбца, airport_id Airlines_id и задержка. Я хочу удалить все аэропорты происхождения, которые имеют менее 5 авиакомпаний.

Я сделал это:

grouped_size = df.groupby(['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID']).size()

Что дает мне количество авиакомпаний на аэропорт (я надеюсь), но я не знаю, как удалить те, у которых менее 5 авиакомпаний. Спасибо!

1 Ответ

0 голосов
/ 12 ноября 2018

Вот простой способ сделать это:

grouped_size = df.groupby(['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID']).size().reset_index()
grouped_size.columns = ['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID', 'size']
hi_mask = grouped_size['size'] > 5
grouped_size = grouped_size[hi_mask]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...