У меня есть фрейм df, содержащий данные просмотра телевизора, я хотел бы запустить проверку QC для перекрывающегося просмотра. Скажем, в один и тот же день, в одном домохозяйстве, для каждого человека каждая минута должна быть зачислена только на одну станцию или канал.
например, я хотел бы отметить строки 8, 9, потому что кажется невозможным, чтобы человек в уникальном доме смотрел две телевизионные станции (62,67) одновременно (start_hour_minute). Мне интересно, есть ли способ пометить эти строки?
Сортировка минут за минутой, просмотр отдельных людей по дням.
df <- data.frame(stringsAsFactors=FALSE,
date = c("2018-09-02", "2018-09-02", "2018-09-02", "2018-09-02",
"2018-09-02", "2018-09-02", "2018-09-02", "2018-09-02",
"2018-09-02"),
householdID = c(18101276L, 18101276L, 18102843L, 18102843L, 18102843L,
18102843L, 18104148L, 18104148L, 18104148L),
Station_id = c(74L, 74L, 62L, 74L, 74L, 74L, 62L, 62L, 67L),
IndID = c("aa", "aa", "aa", "aa", "aa", "aa", "aa", "aa", "aa"),
Start = c(111300L, 143400L, 030000L, 034900L, 064400L, 070500L, 060400L,
075100L, 075100L),
End = c(111459L, 143759L, 033059L, 035359L, 064759L, 070559L, 060459L,
81559L, 81559L),
start_hour_minute = c(1113L, 1434L, 0300L, 0349L, 0644L, 0705L, 0604L, 0751L, 0751L),
end_hour_minute = c(1114L, 1437L, 0330L, 0353L, 0647L, 0705L, 0604L, 0815L, 0815L))