Я применил CountVectorizer()
к своему X_train
, и он вернул разреженную матрицу.
Обычно, если мы хотим стандартизировать разреженную матрицу, мы передаем with_mean=False
параметр.
scaler = StandardScaler(with_mean=False)
X_train = scaler.fit_transform()
Но в моем случае после применения CountVectorizer на моем X_train
я также выполнил PCA (TruncatedSVD), чтобы уменьшить размеры. Теперь мои данные не являются разреженной матрицей.
Так что теперь я могу применить StandardScaler()
напрямую, не пропуская with_mean=False
(i.e with_mean=True)
?