RFECV сходятся и стагнируют от 30 до 40 функций, но лучшая модель имеет 140 функций - PullRequest
0 голосов
/ 18 января 2019

У меня 145 функций на 7800 выборках, и я пытаюсь использовать RFECV для обучения гауссовского наивного байесовского алгоритма, логистической регрессии и линейного SVM.

Глядя на график выше, модели LR и SVM начинают стагнировать от 30 до 40 функций. Это признак переоснащения? Он по-прежнему выполнил 140 функций для обеих моделей, поскольку RFECV сообщит вам только набор функций, который достиг высочайшей точности. Между 30–140 функциями есть лишь небольшая разница в точности, так что же здесь делать умнее? Применяю ли я то же количество функций, что и у Наивного Байеса, как на LR, так и на SVM (в данном случае это 39 функций)?

Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...