Является ли мой подход к перекрестной проверке одного теста для минимизации ошибок предсказания? # features = 9; # предметов = 18 - PullRequest
0 голосов
/ 15 января 2019

Я хочу создать прогнозную модель линейной регрессии. В наборе данных есть 18 предметов и 9 функций на предмет. Поскольку существует только 2 ^ 9 = 512 возможных подмножеств для 9 объектов, я проверил все возможные комбинации, используя перекрестную проверку с опущением одного элемента, и выбрал подмножество объектов с наименьшей среднеквадратичной ошибкой, и результаты выглядят довольно неплохо. Так как я новичок в машинном обучении, я не уверен, что это правильный подход, учитывая, что есть только 18 предметов и 512 подмножеств. Является ли это разумным подходом для выбора подмножества функций, или числа (особенности по сравнению с субъектами) могут привести к переобучению? Если да, то какой совет по поводу более подходящих подходов?

...