Я хочу создать конвейер для задачи классификации текста с несколькими метками с Python. Для одной метки я могу создать такой конвейер на основе этой ссылки :
parameters = {
'vect__ngram_range': [(1, 1), (1, 2)],
'tfidf__use_idf': (True, False),
'clf__alpha': (1e-2, 1e-3),
}
gs_clf = GridSearchCV(text_clf, parameters, cv=5, n_jobs=-1)
Однако, как вы подходите, если хотите создать конвейер с многоуровневыми модулями Scikit? , например, бинарная релевантность для решения многоканальной задачи классификации? Один пример конвейера эта ссылка :
parameters = [
{
'classifier': [MultinomialNB()],
'classifier__alpha': [0.7, 1.0],
},
{
'classifier': [SVC()],
'classifier__kernel': ['rbf', 'linear'],
},
]
clf = GridSearchCV(BinaryRelevance(), parameters, scoring='accuracy')
Как вы объедините оба эти примера в один конвейер? Я хотел бы добавить векторизатор к многоуровневой задаче, но я не знаю, как преобразовать параметр в формат, который может быть обработан методом двоичной релевантности. Любая помощь приветствуется, спасибо.