Трубопровод для классификации нескольких меток по Scikit-multilearn - PullRequest
0 голосов
/ 02 марта 2020

Я хочу создать конвейер для задачи классификации текста с несколькими метками с Python. Для одной метки я могу создать такой конвейер на основе этой ссылки :

parameters = {
     'vect__ngram_range': [(1, 1), (1, 2)],
     'tfidf__use_idf': (True, False),
     'clf__alpha': (1e-2, 1e-3),
}

gs_clf = GridSearchCV(text_clf, parameters, cv=5, n_jobs=-1)

Однако, как вы подходите, если хотите создать конвейер с многоуровневыми модулями Scikit? , например, бинарная релевантность для решения многоканальной задачи классификации? Один пример конвейера эта ссылка :

parameters = [
    {
        'classifier': [MultinomialNB()],
        'classifier__alpha': [0.7, 1.0],
    },
    {
        'classifier': [SVC()],
        'classifier__kernel': ['rbf', 'linear'],
    },
]

clf = GridSearchCV(BinaryRelevance(), parameters, scoring='accuracy')

Как вы объедините оба эти примера в один конвейер? Я хотел бы добавить векторизатор к многоуровневой задаче, но я не знаю, как преобразовать параметр в формат, который может быть обработан методом двоичной релевантности. Любая помощь приветствуется, спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...