Выбор объектов с использованием фильтра для решения проблемы мультикласса. Что если многие функции строго предсказывают несколько классов? - PullRequest
0 голосов
/ 07 февраля 2019

Я делаю классификацию текста с более чем 100 классами.Во-первых, я хотел бы сделать выбор функции, используя подход фильтра (взаимная информация или chi2).

Я планировал использовать sklearn.feature_selection.SelectPercentile, но теперь мне интересно: согласно статье Подводный камень и решение в выборе нескольких классов для классификации текста этот подход должен дать плохой результатесли некоторые из моих функций являются строго прогнозирующими для некоторых классов, но имеют низкие баллы в их значении chi2 / MI для других классов.

Как я могу реализовать процедуру, в которой каждый класс по очереди выбирает наиболее подходящую для этого функциюопределенный класс?Это уже реализовано как-то в Python?

...