Я относительно новичок в glm, поэтому, пожалуйста, потерпите меня.
Я создал glm (logisti c regression), чтобы предсказать, ПРОДОЛЖАЕТ ли человек учиться («0») или НЕ ПРОДОЛЖАЕТ («1»). Мне интересно предсказать последнее. В glm используются семь факторов в наборе данных, и матрицы путаницы очень хороши для того, что мне нужно, также было выполнено объединение данных за семь лет. Прямо вперед.
Однако теперь мне нужно применить модель к данным за текущие годы, в которых, конечно, нет столбца NOTCONTINUE. Допустим, модель glm - «CombinedYears», а новые данные - «Data2020»
Как я могу использовать модель glm, чтобы получить прогнозы о том, кто будет («0») или НЕ («1») продолжить их учеба? Мне нужно вставить столбец NOTCONTINUE в последний файл ?? Я пробовал эту структуру
Predict2020 <- predict (CombinedYears, data.frame (Data2020), type = 'response') </p>
, но результат содержит только значения <0,5. </p>
Любая помощь очень признательна. Заранее спасибо