Допустим, играют несколько футбольных матчей. Назначение данных генерируется, когда команда потеряла владение мячом, а продолжительность владения записывается в текстовом файле следующим образом:
'Game','Country','Team','Ball Possession Interval (sec)'
1,Croatia,A,9
2,France,B,11
1,Croatia,A,8
4,Spain,C,10
1,Croatia,B,6
2,France,B,7
3,Germany,C,12
2,France,A,8
...
Игра - это количество игр, в которых до сих пор играла команда. Например, 2,France,B,7
означает, что команда B из Франции, которая сейчас находится во второй игре, только что потеряла мяч через 7 секунд.
Мне бы хотелось, чтобы график, сгруппированный по странам (подзаговор для каждой страны), с командами вдоль оси, и блок-график суммы «Интервал владения мячом (сек)» за игру за команду. Я попробовал следующее,
df.groupby('Country').boxplot(by='Team',column=*vector of sum of ball possession intervals per game*)
но я не знаю, как установить столбец . Я хотел бы установить следующее:
df.groupby(['Country','Team','Game'])['Ball Possession Interval (sec)'].sum()
но это не работает.
Есть ли простой способ сделать это?