R - Машинное обучение: пакеты выбора подмножеств и подходы для категориальной переменной ответа - PullRequest
0 голосов
/ 28 мая 2019

У меня есть набор клинических данных, включающий около 26 переменных (числовые и категориальные), включая переменную ответа.

Категориальная переменная ответа «RETINOPATHY» имеет 2 факторных уровня: «Да» и «Нет».

Теперь, задача состоит в том, чтобы найти наилучшие переменные свойства из 26 для прогнозирования переменной категориального ответа. Проверьте значение AIC (Akaike) и т. Д. Для другого подмножества.

Я обнаружил, что библиотека под названием «прыжки» довольно удобна для этой задачи, но она работает только тогда, когда переменная ответа Числовая . «regsubsets» не будет работать для категориальных переменных, поскольку он основан на линейной регрессии. см. ниже:

regsubsets(finalDataDF$RETINOPATHY~., data = finalDataDF, nbest = 5, method="exhaustive")

В приведенном выше примере RETINOPATHY является категориальной переменной ответа, которая является функцией оставшихся переменных.

Я много искал, но не смог получить правильное объяснение, например, какой пакет R доступен, чтобы получить подмножества функций для предсказания RETINOPATHY.

Пожалуйста, ведите меня дальше. Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...