Смущен тем, как работает pandas groupby - PullRequest
0 голосов
/ 02 февраля 2020

Я пытаюсь лучше понять, как groupby работает в Pandas. У меня есть данные о результатах футбола, и я использовал групповую игру несколькими различными способами ниже:

#1
match.groupby(['Home Team','Away Team']).size().reset_index()
#2
match.groupby(['Home Team','Away Team']).size().groupby(level=1).size().reset_index()
#3
match.groupby(['Home Team','Away Team']).size().groupby(level=0).size().reset_index()
#4
match.groupby('Away Team').size().reset_index()
#5
match.groupby('Home Team').size().reset_index()

Я немного уверен в том, почему # 2 не возвращает столько же, сколько # 4, и почему # 3 не возвращает те же значения, что и # 5. Насколько я понимаю, # 2 будет подсчитывать количество игр, сыгранных какой-либо конкретной командой на выезде, хотя он отображает игры команд на выезде следующим образом:

away teams

I поэтому подумал бы, что простая группировка по выездной команде, как в # 4, вернет те же результаты, но это не так. Я неправильно понимаю, как groupby работает здесь?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...