Я пытаюсь разработать модель для задачи классификации с несколькими метками. В моем учебном наборе данных ~ 550 тыс. Наблюдений, 2,7 тыс. Входов и 84 метки (уже одна горячая) для выходов.
Я просмотрел следующие материалы: http://scikit.ml/index.html https://www.analyticsvidhya.com/blog/2017/08/introduction-to-multi-label-classification/ https://towardsdatascience.com/journey-to-the-center-of-multi-label-classification-384c40229bff, который проходит аналогичные способы решения проблемы. Первоначально я рассматривал возможность использования BinaryRelevance с XGBClassifier или MLPClassifier. Я пробовал запустить несколько вариантов следующего кода:
clf_mlp = MultiOutputClassifier(
MLPClassifier(hidden_layer_sizes=(2000,),
activation='relu',
max_iter=10000,
verbose=False,
early_stopping=False
)).fit(X_train, y_train)
predictions_mlp = clf_mlp.predict(X_test)
accuracy_mlp=accuracy_score(y_test,predictions_mlp)
Однако моя точность составляет всего 8% ... какие-либо советы по настройке или другим алгоритмам, которые могут работать лучше?