Я делаю классификацию текста с более чем 100 классами.Во-первых, я хотел бы сделать выбор функции, используя подход фильтра (взаимная информация или chi2).
Я планировал использовать sklearn.feature_selection.SelectPercentile
, но теперь мне интересно: согласно статье Подводный камень и решение в выборе нескольких классов для классификации текста этот подход должен дать плохой результатесли некоторые из моих функций являются строго прогнозирующими для некоторых классов, но имеют низкие баллы в их значении chi2 / MI для других классов.
Как я могу реализовать процедуру, в которой каждый класс по очереди выбирает наиболее подходящую для этого функциюопределенный класс?Это уже реализовано как-то в Python?