Большинство процедур регрессии требуют полных данных, но существует множество методов для обработки пропущенных значений.Это тонкая тема, поэтому я не буду претендовать дать полный ответ здесь и рекомендую немного почитать эту тему.Вкратце, хотя:
- Никогда не удаляйте наблюдения, чтобы решить эту проблему.
- Удаление переменных всегда разрешено, но, очевидно, довольно серьезно с точки зрения бюджета данных.
- Заполнение пропущенных значений глобальными константами, такими как среднее значение или медиана не пропущенных значений, должно выполняться экономно (если доля пропусков очень мала), если вообще.
- Заполнение пропущенных значенийсо значениями, выбранными на основе других независимых переменных, предпочтительнее числа выше 3.
Чтобы узнать больше об этом предмете, ищите информацию о терминах "вменение", особенно "одно вменение" и "множественное вменение""," отсутствует наугад "и" полностью отсутствует наугад ".