У меня есть план повторных измерений с категориальными переменными. Допустим, участники сообщили о своем отношении («Одобрить», «Нейтрально», «Отклонить») в моменты времени 1 и 2. Затем я создаю таблицу с частотами комбинаций ответов.
# setup
set.seed(123)
library(tidyverse)
# made-up data
survey.data <- data.frame(
`1st survey` = c('Approve', 'Approve', 'Neutral', 'Approve'),
`2nd survey` = c('Approve', 'Disapprove', 'Approve', 'Neutral'),
`Counts` = c(79, 15, 86, 10),
check.names = FALSE
) %>%
tidyr::uncount(., Counts) %>%
tibble::as_tibble()
# table of counts
table("1" = survey.data$`1st survey`, "2" = survey.data$`2nd survey`)
#> 2
#> 1 Approve Disapprove Neutral
#> Approve 79 15 10
#> Neutral 86 0 0
Обратите внимание, что поскольку никто не выбрал параметр "Disapprove"
в момент времени 1, он отсутствует в таблице. Это, конечно, ожидаемо. Но функция, которую я хочу использовать (rcompanion::cohenG
), ожидает одинаковое количество строк и столбцов в таблице. Поэтому мне было интересно, как я могу изменить код выше, чтобы получить ожидаемый результат здесь -
#> 2
#> 1 Approve Disapprove Neutral
#> Approve 79 15 10
#> Disapprove 0 0 0
#> Neutral 86 0 0