Рассчитать средние значения для уникальных значений с Numpy - PullRequest
0 голосов
/ 02 декабря 2018

У меня есть набор данных, который включает все футбольные данные матчей, сыгранных в Премьер-лиге.Набор данных имеет следующую структуру:

enter image description here

Для моего вопроса важны следующие переменные: home , away, home_xG и away_xG .Я хочу использовать Numpy и рассчитать среднее значение xG каждой команды за весь сезон / набор данных.Я получил следующий (незавершенный) код:

teams = np.sort(dataset['home'].unique())
for team in teams:
    home_xG = ...
    away_xG = ...
    xG = (away_xG + home_xG) / 2

 return team_xG

Как использовать функцию SUMIFS в Excel для вычисления home_xG и away_xG В идеале я хотел бы использовать Numpy ине функция Panda DataFrame.groupby Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...