Проблема, с которой я столкнулся, заключается в том, что я хочу предсказать победу команды над другой, для этого я хочу, чтобы в каждом матче был выигрыш каждой команды до даты матча.
Однакоиспользование df.groupBy("teamName").agg({"isVictory":"mean"})
дает мне глобальный член команды, который нельзя использовать, потому что вы не должны знать выигрыш всех матчей в данный момент.
Так что я хотел бы получить выигрышиз совпадений до этого, зная, что в моем DataFrame есть столбец index
, в котором хранится порядок совпадения (т. е. если индекс совпадения меньше, чем индекс текущего совпадения, это означает, что совпадение выполненопрежде, таким образом, это совпадение следует рассматривать как среднее значение)
Обратите внимание, что мои столбцы:
indexMatch, nameTeam, isVictoryTeam
(isVictoryTeam =если команда 1 выиграла, и 0, если команда проиграла)
пример набора данных:
IndexMatch isVictoryTeam team winrate
0 1 1 a NaN
1 2 0 a 1
2 3 1 a 0.5
3 4 1 a 0.6667
Ожидаемая скорость передачи - это ожидаемый результат.
Заранее спасибо за вашу помощь.