Большинство методов выбора функций, таких как модели-обертки, требуют сравнения производительности модели при использовании различных комбинаций функций.
Перекрестная проверка обеспечивает более надежные средства сравнения производительности при использовании различных поднаборов функций и, следовательно, более надежный процесс выбора функций. Например, если используется перекрестная проверка с K-кратным смещением, сравнение будет основано на среднем значении ошибок из разных сгибов данных, и, следовательно, будет выбрано подмножество, которое приведет к наименьшей ошибке обобщения.
Кроме того, оптимальные гиперпараметры не обязательно одинаковы для разных комбинаций признаков. Перекрестная проверка помогает с настройкой и, следовательно, обеспечивает более справедливое сравнение.
Этот также является информативным ресурсом по этой теме c.