У меня есть набор данных, который включает все футбольные данные матчей, сыгранных в Премьер-лиге.Набор данных имеет следующую структуру:
Для моего вопроса важны следующие переменные: home , away, home_xG и away_xG .Я хочу использовать Numpy и рассчитать среднее значение xG каждой команды за весь сезон / набор данных.Я получил следующий (незавершенный) код:
teams = np.sort(dataset['home'].unique())
for team in teams:
home_xG = ...
away_xG = ...
xG = (away_xG + home_xG) / 2
return team_xG
Как использовать функцию SUMIFS в Excel для вычисления home_xG и away_xG В идеале я хотел бы использовать Numpy ине функция Panda DataFrame.groupby Спасибо!