В моем конвейере scikits-learn я хотел бы передать пользовательский словарь CountVectorizer ():
text_classifier = Pipeline([
('count', CountVectorizer(vocabulary=myvocab)),
('tfidf', TfidfTransformer()),
('clf', LinearSVC(C=1000))
])
Однако, насколько я понимаю, когда я звоню
text_classifier.fit(X_train, y_train)
Pipeline использует метод Count_ectorizer () fit_transform (), который игнорирует myvocab.Как я могу изменить мой конвейер для использования myvocab?Спасибо!