Я хотел бы получить вывод кадра данных, в котором записаны значения 2 из 4 уровней («Да» и «Нет») переменной. Я могу сделать это путем поднабора и фильтрации на да или нет, но я чувствую, что должен быть лучший способ сделать это с помощью dplyr
null.ta <- dbdata %>%
filter(MutGroup == "Null") %>%
group_by(ICD_Grouping) %>%
summarise(n()) %>%
spread(???????)
Выше я предполагаю, что мне нужно сделать что-то, но я не знаю, как заставить функцию распространения работать с этой конкретной переменной. Я не против, если все 4 уровня включены, тогда я могу просто вырезать пару столбцов по факту.
structure(list(ICD_Grouping = structure(c(50L, 50L, 33L, 33L,
50L, 50L, 50L, 18L, 21L, 33L, 18L, 18L, 50L, 50L, 50L, 17L, 17L,
17L, 17L, 17L, 17L, 50L, 50L, 50L, 50L, 18L, 18L, 16L, 50L, 50L,
50L, 16L, 17L, 50L, 50L, 50L, 16L, 16L, 30L, 50L, 50L, 16L, 18L,
17L, 50L, 50L, 50L, 50L, 50L, 50L, 21L, 30L, 21L, 18L, 21L, 21L,
13L, 30L, 50L, 50L, 50L, 50L, 13L, 34L, 33L, 18L, 16L, 16L, 16L,
16L, 18L, 10L, 34L, 37L, 34L, 34L, 18L, 33L, 33L, 18L, 18L, 37L,
50L, 30L, 30L, 50L, 50L, 50L, 50L, 50L, 50L, 34L, 34L, 33L, 17L,
14L, 19L, 33L, 18L, 18L, 18L, 50L, 30L, 30L, 30L, 34L, 18L, 18L,
18L, 18L, 30L, 30L, 17L, 17L, 33L), .Label = c("", "C01-2", "C03-6",
"C09-10", "C11", "C15", "C16", "C18-20", "C21", "C22", "C25",
"C30-31", "C33-34", "C37-39", "C40-41", "C43", "C44", "C45",
"C47/49", "C48", "C50", "C51", "C53", "C54-55", "C56", "C57-58",
"C60", "C61", "C62", "C64", "C65-66/68", "C67", "C69", "C70",
"C71", "C72", "C73", "C74-75", "C76.0", "C76.2", "C76.3", "C80",
"C81", "C82-86", "C90.0", "C91.0", "C94.3/95", "D04", "D05",
"D22", "D31", "D33", "D35"), class = "factor"), Immunohistochemistry = structure(c(2L,
2L, 2L, 2L, 2L, 2L, 2L, 4L, 4L, 2L, 4L, 4L, 4L, 4L, 4L, 4L, 4L,
4L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L,
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L,
4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L,
4L, 4L, 3L, 3L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 4L, 2L, 2L, 4L, 4L,
4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 2L,
2L, 4L, 4L, 2L, 4L, 4L, 4L, 4L, 2L, 4L, 2L, 4L, 4L, 4L, 4L, 3L,
3L, 4L), .Label = c("", "N/A", "No", "Yes"), class = "factor")), row.names = c(NA,
-115L), class = "data.frame")
И я хотел бы вывод, который будет выглядеть как
ICD_Grouping Yes No N/A
C22 2 1 0
C45 7 3 1
C69 4 0 0
Это пример случайных данных, а не этих данных. Хотелось бы получить фрейм данных с подсчетами каждого факторного уровня в иммуногистохимии по ICD_Grouping.