Фрейм данных содержит все командное имущество, которое заканчивается целью. Каждая строка представляет событие мяча, в котором подробно описывается, какой игрок принимал участие, тип действия, а также позиция x и позиция, на которой он произошел на поле.
#sample df
pass_goal = pd.DataFrame({'match_id': [1107073,1107073,1107073,1409630,1409630,1409630,1509730,1509730,1509730,1509730],
'possession_number': [2,2,2,40,40,40,100,100,100,100],
'second': [10,15,20,250,260,270,300,310,320,330],
'action_name': ['pass', 'pass', 'goal','pass','pass','goal','pass','pass','pass','goal'],
'player_name': ['a','b','b','b','a','a','d','e','c','c',]})
Поэтому моя проблема заключается в том, что я хочу отслеживать различные последовательности / потоки. которые происходят для каждого владения. Один из подходов, который я испробовал, но потерпел неудачу, заключался в подсчете уникальных игроков с помощьюion-идентификатора владения.
Например, обладание 2 => игрок a передает пас игроку b, игрок b стреляет и забивает (я хочу определить это как ABG), другой Примером может быть владение 40 => игрок b передает игроку a, игрок a стреляет и забивает (даже если имена игроков разные, это также должно быть определено как та же последовательность, что и у первого)
Очевидно, что есть было задействовано много более сложных комбинаций, таких как несколько игроков ABCDAG, но я держал образец df как можно более простым
Не уверен, что есть такой простой подход к этому, но мой предпочтительный результат, если достижимо, будет
Sequence Count
ABG 2
ABCG 1