Проблема при создании таблицы сопряженности в R - PullRequest
0 голосов
/ 16 января 2020

Я использую пакет ISLR для своей практики статистики. Я использую набор данных OJ. Я пытаюсь создать таблицу сопряженности для столбца «Покупка» и столбцов specialPrice для численности населения.

Я пытаюсь определить вероятность продажи CH при наличии специальной цены.

Вот мой код.

library(ISLR)
CH <- table(OJ[OJ$Purchase == 'CH', "SpecialCH"])
MM <- table(OJ[OJ$Purchase == 'MM', "SpecialMM"])
table (MM, CH)

Результат, который я получаю, немного странный.

     CH
MM    121 532
  101   1   0
  316   0   1

Я пытаюсь найти соотношение шансов и в конечном итоге применить тест Макнемара. Но я не могу создать таблицу непредвиденных обстоятельств. Я могу сделать это вручную, но нужно сделать это в R.

1 Ответ

0 голосов
/ 16 января 2020

Вы пытаетесь работать с 3 переменными, но таблица непредвиденных расходов использует только 2. Я рекомендую использовать xtabs, так как метод формулы экономит некоторую типизацию и лучше выполняет маркировку таблицы:

xtabs(~SpecialMM+SpecialCH, OJ)  # Only 4 weeks are both on special
#          SpecialCH
# SpecialMM   0   1
#         0 743 154
#         1 169   4 
xtabs(~Purchase+SpecialCH, OJ)   # When CH is on special ca 75% CH
#         SpecialCH
# Purchase   0   1
#       CH 532 121
#       MM 380  37
# xtabs(~Purchase+SpecialMM, OJ)  # When MM is on special ca 58% MM
#         SpecialMM
# Purchase   0   1
#       CH 581  72
#       MM 316 101

Первая таблица задает вопрос. Есть специальные предложения для одного бренда, связанные с другим брендом. Представлено 1070 покупок OJ. CH был в особом 158 раз, а MM был в особом 173 раз. Но только 4 раза оба бренда являются особыми. Эта таблица показывает, что ММ и СН не находятся в специальном положении одновременно. Вы можете использовать Чи-сквер или другой тест, чтобы увидеть, является ли это значительным отклонением от случайного назначения спец. другой марки, когда она продается. Обратите внимание, что большинство покупок OJ происходит, когда ни один из них не продается, но может случиться так, что продажи увеличат покупку бренда в продаже. Опять же, статистические тесты подскажут вам, может ли это быть случайным или маловероятным.

...