Как настроить многолабильную классификацию? - PullRequest
1 голос
/ 18 марта 2020

Я пытаюсь разработать модель для задачи классификации с несколькими метками. В моем учебном наборе данных ~ 550 тыс. Наблюдений, 2,7 тыс. Входов и 84 метки (уже одна горячая) для выходов.

Я просмотрел следующие материалы: http://scikit.ml/index.html https://www.analyticsvidhya.com/blog/2017/08/introduction-to-multi-label-classification/ https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff, который проходит аналогичные способы решения проблемы. Первоначально я рассматривал возможность использования BinaryRelevance с XGBClassifier или MLPClassifier. Я пробовал запустить несколько вариантов следующего кода:

clf_mlp = MultiOutputClassifier(
        MLPClassifier(hidden_layer_sizes=(2000,),
                     activation='relu', 
                    max_iter=10000, 
                    verbose=False, 
                    early_stopping=False
                     )).fit(X_train, y_train)
predictions_mlp = clf_mlp.predict(X_test)
accuracy_mlp=accuracy_score(y_test,predictions_mlp)

Однако моя точность составляет всего 8% ... какие-либо советы по настройке или другим алгоритмам, которые могут работать лучше?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...