Мои данные выглядят так
set.seed(89)
d <- data.frame(
ID=seq(1, 100),
Encounter=sample(c(1:50), 100, replace = TRUE),
EffortType=sample(c("A","B","C"), 100, replace = TRUE)
)
Я рассматриваю переменную Encounter как фактор.
Я хотел бы знать частоты возможных комбинаций EffortType.
Я бы хотел, чтобы результаты выглядели примерно так
EffortType N
A 8
B 8
C 9
A,B 4
A,C 8
B,C 5
A,B,C 3
Я бы также хотел иметь возможность подмножества данных комбинациями EffortType. Например, я хотел бы получить подмножество EffortType A, B, которое выглядит примерно так:
ID Encounter EffortType
52 2 A
53 2 B
61 2 A
63 2 A
79 2 A
36 7 B
59 7 B
83 7 A
etc.
Я попытался изменить данные таким образом, чтобы у меня были отдельные переменные для каждого уровня EffortType, используя «mutate», а затем попытался подсчитать количество экземпляров каждой комбинации, но я делаю это неправильно, как показано ниже. Я не могу понять, как «группировать» по встрече, прежде чем делать подсчет.
d = mutate(d,
A = ifelse(grepl("A", EffortType), T, F),
B = ifelse(grepl("B", EffortType), T, F),
C = ifelse(grepl("C", EffortType), T, F))
d = data.table(d)
d[, .N, by = c('Encounter', 'A', 'B', 'C')]
Но я не заканчиваю резюме, на которое я надеюсь. Пожалуйста помоги. Thx.