Регрессия или классификация? - PullRequest
0 голосов
/ 05 февраля 2019

При использовании нейронной сети для прогнозирования процента ошибок производственного процесса, где есть какие-то входные данные в процесс вне нашего контроля (случайный), лучше ли использовать регрессию или классификацию?

Пример,

Выходными данными могут быть коэффициенты ошибок в диапазоне от -900% до + 900% со средним и средним значением ошибки, равным 9% (это кривая с толстым хвостом).Если мы используем регрессию и пытаемся предсказать количество ошибок или классифицировать ошибки по сигмам по медиане, например, 900% - это 5 сигм по медиане.Поэтому у нас будет 11 категорий от -5 до +5

1 Ответ

0 голосов
/ 07 февраля 2019

Вывод зависит от вашего варианта использования, гораздо больше, чем от данных.После обучения этой модели вы будете использовать ее, задав ей входной вектор, одну серию входных данных.Ваша модель выдаст выходной номер.Что вы планируете делать с этим выходным номером?В качестве аргумента давайте рассмотрим два аналогичных прогноза на полпути в положительную сторону.

Ваши результаты: +2, +2 (классификация) или + 350%, + 380% (регрессия).

Вам нужно одинаково реагировать на два выхода?Все ли со значением примерно +2 получают одинаковую обработку - если да, у вас есть четкое обоснование для классификации - или есть небольшие различия, основанные на относительной величине, - предполагающие регрессионную модель.

Кроме того, чтотипы моделей вы рассматриваете?Если вы уже выбрали относительно простой ANN, то вы можете также сделать его регрессионной моделью и получить дополнительную «точность» в прогнозировании.Если вы найдете преимущество для некоторых нелинейных функций или простоту категорий (в отличие от экспериментов с различными нелинейными терминами для уравнения регрессии), используйте метод классификации.

...