У меня есть набор данных с одной линией на счет на игрока за игру. Игрок может играть несколько раз в день в нескольких играх.
Мне нужно вычислить среднее количество очков в день на игрока за игру и среднее количество очков всех игроков в день за игру. У меня при этом есть следующее, что на данный момент работает нормально.
team_score=df.groupby(['Team','Game']).resample('D', on='date').mean().ffill().reset_index()
Теперь каждый игрок может войти в игру в любой момент и покинуть игру в любой момент. Мне нужно, чтобы у всех игроков была ценность для каждой даты игры. Благодаря .resample () у меня есть значение даты для каждого дня, когда они играли. Я хотел бы иметь значение даты для каждого дня игры.
В наборе данных есть столбцы для start_date и end_date. Я играю по поводу следующего, но безуспешно
start= df.groupby(['Team', 'Event']).agg({'date': [np.min]})
end= df.groupby(['Team', 'Event']).agg({'date': [np.max]})
index=(start, end)
Я также думаю о том, чтобы смотреть на мультииндекс вместо ресэмпла. Вы все еще можете ffill()
при использовании мультииндексирования?