У меня проблема с бинарной классификацией, включающая около 30 функций и конечную метку прохождения / неудачи.Сначала я обучил классификатор, чтобы он мог предсказать, пройдут ли новые экземпляры или не получится, но теперь я хочу получить более глубокое понимание.
Как я могу получить некоторый анализ того, почему эти элементы проходят или не проходят в зависимости от их характеристик?В идеале я хотел бы показать основные факторы, связанные с весом каждого из них.Сложность в том, что мои функции не обязательно статистически независимы друг от друга.Какие методы я должен изучить, какие ключевые слова будут указывать мне в правильном направлении?
Некоторые начальные мысли: Используйте классификатор дерева решений (ID3 или CART) и посмотрите на верхнюю часть дерева для определения главных факторов.Я не уверен, насколько надежным был бы такой подход, и мне не сразу понятно, как можно назначить важность каждого фактора (можно было бы просто получить упорядоченный список).