в регрессии (логистической), как вы можете преобразовать MNAR (отсутствующие не случайно) в переменную, которая не является категориальной? - PullRequest
0 голосов
/ 03 октября 2019

Предположим, у меня есть двоичный результат, который имеет 5 входных переменных. для одной из переменных это числовая переменная, но на 20% пропущено не случайно (например, если они пропускают переменную, это очень говорит о результате и, вероятно, является прогнозирующим).
Если оно было категоричным (скажем,, "мужчина", "женщина"), я мог бы легко изменить НС на что-то вроде "другой / пропавший". Но как мне сделать это для числового? Когда я выделяю его в качестве категориального, чем я заменяю его в числовой группе?

возможно ли это?

1 Ответ

0 голосов
/ 03 октября 2019

Предлагаемое предложение для максимизации информативного значения простым способом, в логистической регрессии, для MNAR (отсутствует случайно) состоит в том, чтобы перекодировать NA в другую категориальную / двоичную переменную и изменить NA на медианное значение, таким образом,Переменная двоичного флага может / должна охватывать значимую дисперсию наблюдений MNAR этой переменной.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...