Какая (ML / DL) модель лучше всего подходит для мультиклассовой классификации для небольших наборов данных? - PullRequest
1 голос
/ 14 февраля 2020

Я работаю с набором данных о состоянии здоровья.

Набор данных о сигналах тела (8 функций), а целевая переменная - температура тела при сбое. Было 6 разных температур или мультиклассов. (цели)

Мой набор данных имеет форму (1500 * 9) - Числовые данные

Я установил свои данные с RMClassifier, но он показывает точность около 80%. Но мне нужно моя точность и оценка F1 будут улучшены еще больше. С другой стороны, я настраиваю некоторые параметры для большей точности.

Помимо «Случайного леса», я хотел бы получить предложение о том, какая модель будет лучшим выбором для моей вышеупомянутой проблемы. Поскольку мой набор данных небольшой, я не уверен в выборе лучшей модели ML

. Я думал о том, чтобы выбрать boosting,SVM or Neural Nets. Пожалуйста, поделитесь своими мыслями.

1 Ответ

2 голосов
/ 14 февраля 2020

Чтобы найти лучшую модель для вашей проблемы, вы можете использовать GridSearchCV из Scikit-learn. Используйте конвейер и настройте GridSearchCV, чтобы экспериментировать с различными методами обучения, изменяя их гиперпараметры. Он найдет для вас лучшую модель ML.

Группа исследователей, обнаружившая с помощью качественных и количественных данных, производительность разных моделей ML несколько различается (практическое машинное обучение с Scikit-Learn и TensorFlow, первое издание , стр. 23). Вы также должны потратить некоторые усилия на разработку функций, чтобы увидеть, сможете ли вы увеличить количество функций. Вы можете получить представление об этом Titani c решении

...