У меня есть текстовые данные (твиты), классифицированные как положительные, нейтральные и отрицательные. Я хочу проверить, будет ли KNN работать лучше при уменьшенных размерах. Я тестировал KNN с другими CountVectorizer (отличающимися max_feature) от sklearn, но он ничего не делал. Есть ли смысл применять, например, PCA или коллектор? Если да, как применить их к текстовым данным?