Я хочу найти последовательность последовательных строк в наборе данных, где условие выполняется наиболее часто.
У меня есть два столбца, которые я могу использовать для этого;Либо один с единицами и нулями, которые чередуются в зависимости от наличия или отсутствия условия, либо столбец, который увеличивается в течение времени, в течение которого присутствует желаемое условие.Я предполагаю, что мне нужно будет использовать subset () , filter () и / или rle () , чтобы это произошло, но я нахожусь напотеря в том, как заставить его работать.
В этом примере я хочу найти 6 последовательных строк, которые максимизируют случаи, в которых happens
встречается.
Учитывая входные данные:
library(data.frame)
df<-data.frame(time=c(1:10),happens=c(1,1,0,0,1,1,1,0,1,1),count=c(1,2,0,0,1,2,3,0,1,2))
Я хотел бы видеть в качестве выходных данных строки с 5 по 10 включительно в качестве выходных данных подмножества, используя столбцы happens
или count
, так как эта последовательность строк даст наивысший выходной результат.happens
вхождений в 6 последовательных строках.