Как кодировать предиктор в регрессии logisti c, когда некоторые значения намеренно неизвестны - PullRequest
0 голосов
/ 29 января 2020

Я решил разместить здесь свой вопрос, потому что, строго говоря, он связан с кодированием.

Проблема заключается в следующем. В психологическом эксперименте, включающем два условия, независимая переменная - состоящая из числовых значений c - присутствовала в одном состоянии, но не в другом. Соответственно, в одном условии указанная переменная предоставляла соответствующую информацию и находилась в диапазоне от 0 до 20. В других условиях участникам просто не предоставлялась такая информация.

Связывая данные во втором условии - когда участникам не была предоставлена ​​такая информация - я закодировал переменную как NA. Однако, когда я запускаю свою модель logisti c, установка na.action = na.omit приводит к сбою модели.

В принципе, NA в моих данных - это не пропущенные значения, а, в соответствии с В экспериментальном плане хотелось бы отразить отсутствие этой информации в одном из условий.

Поэтому мне кажется, что многовариантное вменение - как могло бы быть реализовано с помощью мышей или других пакетов - не является правильным ходом действие. На самом деле, если бы я захотел, я мог бы просто получить интересующие вас значения, но включать их в данные было бы неправильно, потому что, как уже упоминалось, участники не могли знать их значения.

Существует ли какая-либо стратегия для кодирования таких неизвестных значений и решения этой проблемы?

Любая помощь будет принята с благодарностью. Большое спасибо!

...