Как обрабатывать пропущенные значения в линейной регрессии? - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть фрейм данных с 60 переменными, и все переменные имеют пропущенные значения таким образом, что ни одна из строк не является полной:

complete.cases(data)
  [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [28] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [55] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
 [82] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE
[109] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

Так что, я думаю, я не могу использовать линейную регрессию для вычисления пропущенных значений. Любая идея, как я могу справиться с ними, чтобы я мог выполнить свою линейную регрессию?

1 Ответ

1 голос
/ 15 апреля 2020

Обработка пропущенных значений может включать:

  1. Лучше всего пропустить переменные, для которых пропущено большинство наблюдений.

  2. Пропуск строк / наблюдения / случаи с пропущенными значениями. Эта стратегия упоминается как удаление по списку или полный анализ случая. Это возможно, если тип пропуска - MCAR (отсутствует полностью случайно), и после удаления остается достаточно большая выборка.

  3. Различные методы вменения: среднее / медиана / замена режима, регрессионное вычисление, ожидание-максимизация (EM), множественное вычисление и т. д. c.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...