У меня есть набор клинических данных, включающий около 26 переменных (числовые и категориальные), включая переменную ответа.
Категориальная переменная ответа «RETINOPATHY» имеет 2 факторных уровня: «Да» и «Нет».
Теперь, задача состоит в том, чтобы найти наилучшие переменные свойства из 26 для прогнозирования переменной категориального ответа. Проверьте значение AIC (Akaike) и т. Д. Для другого подмножества.
Я обнаружил, что библиотека под названием «прыжки» довольно удобна для этой задачи, но она работает только тогда, когда переменная ответа Числовая . «regsubsets» не будет работать для категориальных переменных, поскольку он основан на линейной регрессии. см. ниже:
regsubsets(finalDataDF$RETINOPATHY~., data = finalDataDF, nbest = 5, method="exhaustive")
В приведенном выше примере RETINOPATHY является категориальной переменной ответа, которая является функцией оставшихся переменных.
Я много искал, но не смог получить правильное объяснение, например, какой пакет R доступен, чтобы получить подмножества функций для предсказания RETINOPATHY.
Пожалуйста, ведите меня дальше. Заранее спасибо.