Мой конвейер SKLearn состоит из пользовательской обработки, которая «возвращает» возвращаемое значение sample.process ().
следующая операция в конвейере - TruncatedSVD, которая завершается неудачно, так как кажется, что она не может читать объекты генератора.
model = Pipeline([
('processor', Pipeline([
('processor', DocumentProcessor()),
('svd', TruncatedSVD())
])),
('selector', SelectKBest(score_func = chi2)),
('clf', None),
])
Ошибка:
Expected 2D array, got scalar array instead:
array=<generator object DocumentProcessor.transform at 0x10ffcc5e8>.
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.
как мне заставить TruncatedSVD принимать объекты генератора?