Я сейчас использую этот подход:
рассчитать среднее значение и дисперсию данных для каждого класса. Хороший кандидат должен иметь небольшую дисперсию, а среднее значение должно отличаться от средних значений других классов.
В настоящее время, имея только <50 функций, я выбираю их вручную. Для автоматизации этого процесса можно рассчитать дисперсии средних значений <strong>среди всех классов и дать более высокий приоритет тем, которые имеют большую дисперсию. Затем выберите сначала те, которые имеют меньшую дисперсию в пределах одного класса.
Конечно, это не удаляет избыточные функции.