Я анализирую некоторые данные опроса и использую expss
для создания таблиц.
Один из наших вопросов касается узнаваемости бренда.У меня есть 3 типа брендов: BrandA - это бренд, который видит большое подмножество образца, BrandB - это бренд, который видит меньшее (взаимоисключающее!) Подмножество образца, а BrandC - это бренд, который видит каждый респондент.
Я хотел бы рассматривать этот вопрос об осведомленности как вопрос с множественными ответами и сообщать процент людей (которые фактически видели бренд), которые знают о каждом бренде.(В этом случае значение 1 означает, что респондент был осведомлен о бренде.)
Наиболее близким, что я могу получить, является использование приведенного ниже кода, но tab_stat_cpct()
не сообщает точные проценты или # изслучаи, как вы можете видеть в прилагаемой таблице.Когда вы сравниваете Общий%, указанный в таблице, с общим%, вычисленным вручную (т. Е. С помощью mean(data$BrandA, na.rm = TRUE)
), это сообщает о значениях, которые являются слишком низкими для BrandA и BrandB, и значением, которое является слишком высоким для BrandC.(Не говоря уже о том, что общее количество дел должно быть 25).
Я прочитал документацию, и я понимаю, что эта проблема связана с тем, как tab_stat_cpct()
определяет «дело» для целейвычисления процента, но я не вижу аргумента, который приспособил бы это определение, чтобы сделать то, что мне нужно.Я что-то пропустил?Или есть какой-то другой способ сообщить точные проценты?Спасибо!
set.seed(123)
data <- data.frame(
Age = sample(c("25-34", "35-54", "55+"), 25, replace = TRUE),
BrandA = c(1, 0, 0, 1, 0, 1, NA, NA, NA, NA, NA, NA, NA, 1,
0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1),
BrandB = c(NA, NA, NA, NA, NA, NA, 1, 1, 0, 1, 0, 1, 1, NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA),
BrandC = c(1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0,
1, 1, 1, 0, 1, 0, 1, 0, 1)
)
data %>%
tab_cells(mrset(as.category(BrandA %to% BrandC))) %>%
tab_cols(total(), Age) %>%
tab_stat_cpct() %>%
tab_last_sig_cpct() %>%
tab_pivot()
## | | #Total | Age | | |
## | | | 25-34 | 35-54 | 55+ |
## | | | A | B | C |
## | ------------ | ------ | ------- | ----- | ---- |
## | BrandA | 52.4 | 83.3 B | 28.6 | 50.0 |
## | BrandB | 23.8 | | 42.9 | 25.0 |
## | BrandC | 71.4 | 100.0 C | 71.4 | 50.0 |
## | #Total cases | 21 | 6 | 7 | 8 |