У меня довольно специфическая c проблема. Я думаю, что я изо всех сил пытался ответить, и думал, что открою ее замечательному сообществу.
У меня есть набор данных, показанный ниже (это подмножества из более чем 30 000 строк - поэтому мы хотим сделать это решение максимально воспроизводимым):
*Date,Home Team,Away Team,League,Home Goals,Away Goals
43389,Everton,Wolves,League,1,3
43364,Man C,Arsenal,League,3,1
43414,Everton,Man C,League,0,2
43385,Liverpool,Bournemouth,League,3,0
43397,Man C,Chelsea,League,6,0
43390,Liverpool,Watford,League,5,0
43381,Man C,West Ham,League,1,0
43392,Man C,Arsenal,League,3,1
43369,Everton,Man C,League,0,2
43375,Liverpool,Bournemouth,League,3,0
43382,Man C,Chelsea,League,6,0
43396,Liverpool,Watford,League,5,0
43373,Man C,West Ham,League,1,0*
В R то, что я хотел бы добавить к каждой из строк, - это полоса, чтобы сказать, как во многих играх каждая команда выиграла подряд (в рамках каждого соревнования) в зависимости от даты, т.е. сколько игр выиграли подряд в хронологическом порядке? В идеале их должно быть четыре колонки -> полоса хозяев дома в гостях, полоса гостей в гостях, общая полоса хозяев дома (хозяева и гости вместе) и полоса хозяев дома (дома и гости вместе). Хотя я уверен, что после того, как одно решение будет найдено, другие смогут воссоздать с использованием аналогичного кода. Я чувствую, что мог бы сделать это в Excel с помощью Count или Sumif, однако я не уверен, как воспроизвести это в R, и хотел бы, чтобы это было как можно более эффективным.
Заранее спасибо за вашу помощь !!
> dput(Data)
structure(list(Date = structure(c(3L, 10L, 12L, 2L, 7L, 13L,
4L, 8L, 9L, 4L, 11L, 1L, 5L, 6L), .Label = c("03/10/2018", "04/10/2018",
"04/11/2018", "09/10/2018", "10/11/2018", "13/09/2018", "16/09/2018",
"16/10/2018", "20/09/2018", "21/10/2018", "22/10/2018", "28/09/2018",
"30/09/2018"), class = "factor"), Home.Team = structure(c(1L,
3L, 1L, 2L, 3L, 2L, 3L, 1L, 3L, 1L, 2L, 3L, 2L, 3L), .Label = c("Everton",
"Liverpool", "Man C"), class = "factor"), Away.Team = structure(c(7L,
1L, 4L, 2L, 3L, 5L, 6L, 7L, 1L, 4L, 2L, 3L, 5L, 6L), .Label = c("Arsenal",
"Bournemouth", "Chelsea", "Man C", "Watford", "West Ham", "Wolves"
), class = "factor"), Competition = structure(c(2L, 2L, 2L, 2L,
2L, 2L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 2L), .Label = c("Cup", "League"
), class = "factor"), Home.Goals = c(1L, 3L, 0L, 3L, 6L, 5L,
1L, 1L, 3L, 0L, 3L, 6L, 5L, 1L), Away.Goals = c(3L, 1L, 2L, 0L,
0L, 0L, 0L, 3L, 1L, 2L, 0L, 0L, 0L, 0L)), .Names = c("Date",
"Home.Team", "Away.Team", "Competition", "Home.Goals", "Away.Goals"
), class = "data.frame", row.names = c(NA, -14L))