Уменьшение размерности в текстовых данных для КНН - PullRequest
0 голосов
/ 25 января 2020

У меня есть текстовые данные (твиты), классифицированные как положительные, нейтральные и отрицательные. Я хочу проверить, будет ли KNN работать лучше при уменьшенных размерах. Я тестировал KNN с другими CountVectorizer (отличающимися max_feature) от sklearn, но он ничего не делал. Есть ли смысл применять, например, PCA или коллектор? Если да, как применить их к текстовым данным?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...