Я пытаюсь лучше понять, как groupby
работает в Pandas. У меня есть данные о результатах футбола, и я использовал групповую игру несколькими различными способами ниже:
#1
match.groupby(['Home Team','Away Team']).size().reset_index()
#2
match.groupby(['Home Team','Away Team']).size().groupby(level=1).size().reset_index()
#3
match.groupby(['Home Team','Away Team']).size().groupby(level=0).size().reset_index()
#4
match.groupby('Away Team').size().reset_index()
#5
match.groupby('Home Team').size().reset_index()
Я немного уверен в том, почему # 2 не возвращает столько же, сколько # 4, и почему # 3 не возвращает те же значения, что и # 5. Насколько я понимаю, # 2 будет подсчитывать количество игр, сыгранных какой-либо конкретной командой на выезде, хотя он отображает игры команд на выезде следующим образом:
I поэтому подумал бы, что простая группировка по выездной команде, как в # 4, вернет те же результаты, но это не так. Я неправильно понимаю, как groupby
работает здесь?