Я хочу сделать тест независимости хи-квадрат для двух категориальных переменных (v1 и v2). Проблема в том, что одна переменная на самом деле является списком. Это означает, что каждое наблюдение должно иметь различные категории, которые составляют v1. (V1 - это набор навыков, необходимых для выполнения работы, а V2 - это уровень Низкий, средний, высокий)
Например
v1.0 v1.1 v1.2 v1.3 v1.4 v2
obs1 чтение команды направления работы, помогающей решению проблем Средний
obs2 решение проблем руководство работа в команде ассистирование чтения Низкий
Направление командной работы obs3, помогающее решать проблемы с чтением Высокий
Я пытался создать разные таблицы (v1.0 ~ v2; v1.1 ~ v2; v1.2 ~ v2 ...), а затем суммировать значения в каждой таблице, но, похоже, это не работает
Я хотел бы иметь таблицу непредвиденных расходов следующим образом:
Low Medium High
чтение
совместная деятельность
направление
содействие
решение проблем
Подсчет каждый раз, когда категория v1 появляется на уровнях v2.