У меня 145 функций на 7800 выборках, и я пытаюсь использовать RFECV для обучения гауссовского наивного байесовского алгоритма, логистической регрессии и линейного SVM.
Глядя на график выше, модели LR и SVM начинают стагнировать от 30 до 40 функций. Это признак переоснащения? Он по-прежнему выполнил 140 функций для обеих моделей, поскольку RFECV сообщит вам только набор функций, который достиг высочайшей точности. Между 30–140 функциями есть лишь небольшая разница в точности, так что же здесь делать умнее? Применяю ли я то же количество функций, что и у Наивного Байеса, как на LR, так и на SVM (в данном случае это 39 функций)?
Спасибо