Этот вопрос вдохновлен этим и этим вопросом.
Я пытаюсь рассчитать долю различных значений в каждой группе, но я не хочу создать «новые» строки для групп, но новые столбцы.
Взяв пример из второго вопроса выше. Если у меня есть следующие данные:
data <- structure(list(value = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,
2L, 2L, 2L, 3L, 3L, 3L, 3L), class = structure(c(1L, 1L, 1L,
2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L), .Label = c("A",
"B"), class = "factor")), .Names = c("value", "class"), class = "data.frame", row.names = c(NA,
-16L))
Я могу рассчитать долю каждого значения (1,2,3) в каждом классе (A, B):
data %>%
group_by(value, class) %>%
summarise(n = n()) %>%
complete(class, fill = list(n = 0)) %>%
group_by(class) %>%
mutate(freq = n / sum(n))
# A tibble: 6 x 4
value class n freq
<int> <fctr> <dbl> <dbl>
1 1 A 3 0.2727273
2 1 B 3 0.6000000
3 2 A 4 0.3636364
4 2 B 2 0.4000000
5 3 A 4 0.3636364
6 3 B 0 0.0000000
Однако Я получаю строку для каждой пары значение / класс, вместо этого хочу что-то вроде этого:
# some code
# A tibble: 6 x 4
class n 1 2 3
<fctr> <dbl> <dbl> <dbl> <dbl>
1 A 11 0.2727273 0.3636364 0.3636364
2 B 5 0.6000000 0.4000000 0.0000000
Со столбцом для каждой группы. Я мог бы написать циклы для создания нового фрейма данных из старого, но я уверен, что есть лучший способ. Есть предложения?
Спасибо