Прогнозирование дискретной числовой цели. Мультиклассовый классификатор или регрессор? - PullRequest
0 голосов
/ 25 февраля 2020

Короче говоря, я пытаюсь придумать ML (и более позднюю модель DL) для прогнозирования управляющей входной переменной моей компьютерной имитационной модели на основе всех других входных переменных модели - давайте назовем их переменными среды. Даст ли симуляция сходящийся результат или нет, зависит от значения управляющей переменной. База данных для этой проблемы была сгенерирована в ходе длительного итеративного моделирования с использованием другого сценария ios. Он состоит из всех входных данных среды, входного значения управления и остаточных значений, которые используются для расчета сходимости.

Проблема заключается в дисбалансе класса. Я использую макрос F1 avg для оценки результатов.

Управляющей переменной является DISCRETE, но только из-за того, что мне пришлось дискретизировать входные данные в среде моделирования. Это неравномерно распределенная сетка размера 17.

Переменные среды являются как числовыми непрерывными, так и дискретными (также из-за дискретизации входных данных в определении моделирования) и категориальными.

Я выбрал XGBoost для алгоритм ML. Я тренирую и классификацию, и регрессионную модель, потому что я не мог решить, какая из них более применима в этом случае. Регрессор округляет непрерывный вывод до ближайшего значения в выходной сетке. Результаты как классификатора, так и регрессионного прогона сопоставимы с небольшим преимуществом со стороны классификатора (оценка: 0,62 против 0,67 F1 avg).

Мой вопрос: Как вы думаете, Имеет ли смысл ставить проблему как классификацию множественных классов только потому, что она, кажется, работает лучше, даже если проблема, естественно, относится к типу регрессии? Следующим шагом является разработка модели DL из табличного инструментария fast.ai. Поскольку ML были быстрыми и легкими в обучении, DL может занимать больше времени и усилий. Интересно, имеет ли смысл продолжать разработку двух моделей или я должен выбрать один подход.

Буду благодарен за любые предложения, особенно если у вас есть некоторый опыт решения аналогичных проблем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...