Уменьшение размерности в текстовых данных для КНН

У меня есть текстовые данные (твиты), классифицированные как положительные, нейтральные и отрицательные. Я хочу проверить, будет ли KNN работать лучше при уменьшенных размерах. Я тестировал KNN с другими CountVectorizer (отличающимися max_feature) от sklearn, но он ничего не делал. Есть ли смысл применять, например, PCA или коллектор? Если да, как применить их к текстовым данным?

Уменьшение размерности в текстовых данных для КНН

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Уменьшение размерности в текстовых данных для КНН

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы