Основными проблемами, решаемыми с помощью контролируемого обучения, являются регрессия и классификация. Существуют разные способы их различения, но, в основном, если ваш вывод непрерывный, скажем, вы вводите вектор и ожидаете, что в качестве выходных данных будет действительное число, вы столкнетесь с проблемой регрессии, тогда как если ваш вывод состоит из классов (дискретный вывод) Допустим, вы ввели вектор и ожидаете «да» или «нет», цифру от 0 до 9, своего рода животное и т. д., вы столкнулись с проблемой классификации.
В задачах классификации вы можете использовать такие метрики, как точность, неправильная классификация, кросс-энтропия, f1-оценка и т. Д., Поскольку они основаны на проверке того, были ли входные данные предсказаны в правильном классе, но в регрессии нет способа сделать это проблемы, просто попытайтесь представить матрицу путаницы с бесконечными классами. В регрессии общими показателями являются, например, среднеквадратичная ошибка и средняя абсолютная ошибка.
В заключение:
- Если вы столкнулись с проблемой классификации, вам следует переключиться на другую модель, такую как Random Forest Clasifier.
- Если вы столкнулись с проблемой регрессии, вам следует переключиться на другую метрику, например среднеквадратическую ошибку. Полезной визуализацией с использованием этой метрики может быть гистограмма ошибок.