У меня есть набор данных с несколькими наблюдениями из нескольких мест, многие из которых имеют несколько наблюдений за ними, например,
ID <- paste("s", seq(1,150,1), sep="")
venue <- paste("L", sample(c(1:40), size=150, replace =T), sep="")
group <- c(rep("A", 100), rep("B", 50))
outcome_variable <- c(rnorm(100, 50, 10), rnorm(50, 40, 12))
reprex <- data.frame(ID,venue,group, outcome_variable)
Я знаю, что могу получить количество наблюдений на группу и сводную статистику для непрерывной переменной например,
reprex %>%
group_by(group) %>%
summarise(obs=n(),
mean_outcome =mean(outcome_variable))
, но есть ли простой способ получить количество различных мест (в которые вложены наблюдения) для каждой группы в этой трубе?
Такое ощущение, что это должно быть очень просто, но я уже некоторое время искал предыдущие вопросы и не могу ничего найти!