Основной вопрос dplyr ... Респонденты могут выбрать несколько компаний, которые они используют.Например:
library(dplyr)
test <- tibble(
CompanyA = rep(c(0:1),5),
CompanyB = rep(c(1),10),
CompanyC = c(1,1,1,1,0,0,1,1,1,1)
)
test
Если бы это был вопрос с принудительным выбором - то есть респонденты могли сделать только один выбор - я бы сделал следующее для основной сводной таблицы:
test %>%
summarise_all(funs(sum), na.rm = TRUE) %>%
gather(Response, n) %>%
arrange(desc(n)) %>%
mutate("%" = round(100*n/sum(n)))
Обратите внимание, однако, что столбец «%» не то, что я хочу.Вместо этого я ищу долю от общего числа респондентов для каждого отдельного варианта ответа (поскольку они могут сделать несколько выборок).
Я пытался добавить mutate(totalrows = nrow(.)) %>%
до summarise_all
команда.Это позволило бы мне использовать эту переменную в качестве знаменателя в более поздней команде mutate
.Тем не менее, summarise_all
устраняет "общее количество" var.
Кроме того, если есть лучший способ сделать это, я открыт для идей.