GroupBy DataFrame и узнать максимальное количество вхождений другого столбца - PullRequest
0 голосов
/ 02 сентября 2018

Я должен использовать groupby () на фрейме данных в python 3.x. Имя столбца - «Происхождение», затем, основываясь на происхождении, я должен определить пункт назначения с максимальным количеством вхождений.

Пример df:

    year    month   day dep_time    sched_dep_time  dep_delay   arr_time    sched_arr_time  arr_delay   origin  dest
0   2013    1       1   517         515              2          830         819              11         EWR     IAH
1   2013    1       1   533         529              4          850         830              20         LGA     IAH
2   2013    1       1   542         540              2          923         850              33         JFK     MIA
3   2013    1       1   544         545             -1          1004        1022            -18         JFK     BQN
4   2013    1       1   554         600             -6          812         837             -25         LGA     ATL
5   2013    1       1   554         558             -4          740         728              12         EWR     ORD
6   2013    1       1   555         600             -5          913         854              19         EWR     FLL
7   2013    1       1   557         600             -3          709         723             -14         LGA     IAD
8   2013    1       1   557         600             -3          838         846              -8         JFK     MCO
9   2013    1       1   558         600             -2          753         745               8         LGA     ORD

Ответы [ 2 ]

0 голосов
/ 04 сентября 2018

Вы можете использовать агрегатные функции, чтобы упростить свою жизнь, и построить на ней графики.

fun={'dest':{'Count':'count'} 
df= df.groupby(['origin','dest']).agg(fun).reset_index()
df.columns=df.columns.droplevel(1)
df
0 голосов
/ 02 сентября 2018

Вы можете использовать следующее, чтобы узнать максимальное количество вхождений другого столбца:

df.groupby(['origin'])['dest'].size().reset_index()

    origin  dest
0   EWR     3
1   JFK     3
2   LGA     4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...